甄鳳超:語料庫語言學研究熱點追蹤與思考

2021-02-15 應用語言學研習

摘要:目前國際上語料庫語言學研究具有什麼特點?有哪些研究熱點?又存在哪些爭議?為了回答這些問題,文章選取國際上具有代表性的語料庫專業期刊International Journal of Corpus Linguistics,述評該刊在2010~2019年十年間發表的所有文章,分析其研究內容,概括其特點,發現研究熱點,並在此基礎上就語料庫短語學、語料庫應用、語料庫與其他學科的交叉、語料庫研究中的統計方法、語料庫研究範式的普適性等系列問題展開探討,以期對國內從事語料庫研究的相關人員有所啟發。
關鍵詞:語料庫語言學;《語料庫語言學國際期刊》;語料庫短語學


1. 文獻述評

我們選擇其中具有代表性的International Journal of Corpus Linguistics(以下簡稱IJCL),分析該刊在2010~2019年十年間發表的所有研究性文章,歸納出如下六大研究熱點:

第一,學習者語料庫研究。比較對象更加多元化;除英語之外的其他語言的學習者語料庫研究也開始受到關注;在已有研究成果基礎上,開拓新的視角,進行學科交叉研究,或更新語料類型;跨學科交叉性研究備受青睞;不斷湧現新的統計方法;更加關注學習者語言的特殊性,針對學習者個體語料庫設計專門的標註、檢索軟體。

第二,基於語料庫的語類研究。語類的類型多樣,研究視角豐富,研究主要採用對比方法。

第三,語料庫建設和分析技術。關注非英語語料庫以及特殊用途語料庫的建設;大力發展口語語料庫建設;建設一些英語特殊語料庫;指出已有分析軟體和統計方法中存在的問題,並提出改進方案;介紹各種新開發的語料庫軟體;嘗試將不同的統計方法應用於語料庫研究。

第四,短語學研究。在已有短語學研究成果的基礎上進一步完善,或提出新的研究對象和術語;採用傳統的研究內容,更換新的語言材料,或者增加新的研究維度;將短語學研究與其他語言學研究進行交叉;非英語語言中的短語特徵。

第五,口語語料庫研究。IJCL在2017年有超過三分之二的文章是有關口語語料庫的研究,其中包括了BNC口語語料庫建設和研究特輯。特輯文章基於BNC口語語料庫,對口語語料進行了社會語言學的分析,其中包括性別、年齡以及其他社會語言學因素分析。其他幾篇口語研究涉及話語標記、非流利現象、詞束、學術口語、非英語類的口語話語、口語與手勢等研究內容。

第六,其他基於語料庫的交叉性研究。如,基於語料庫的批評話語分析研究、翻譯研究、社會語言學研究,以及其他類型的交叉研究和縱向的歷時性研究。


2. 問題與思考

2.1 語料庫短語學研究是否已「江郎才盡」,難出新意?

IJCL近十年持續不斷地發表短語方面的研究,但從研究內容和方法上來看,Sinclair所堅持的語料庫驅動的研究較少,更多的是與其他語言學科交叉性研究。此外,一些新的術語,如「詞彙框架」「搭配網絡」,並沒有引起多大影響。這不僅讓人產生疑慮:語料庫短語學是不是已經發展到頭了?研究者是不是已經「江郎才盡」,難以找到新的研究突破口了?然而,事實並非如此。我們通過研讀Sinclair的系列學說,發現他的短語思想一直在不斷地向縱深發展,其後期提出的一些重要思想是對前期思想的延續和發展,如意義移變單位、局部語法等,但這些重要思想尚未得到充分的闡釋和實踐證明,都將是未來語料庫短語研究的重要內涵。
2.2 語料庫的應用研究是促進還是抑制語料庫語言學的發展?

IJCL上發表了許多語料庫應用研究。這些研究有一共同特點,即把語料庫視為語言數據來源,用於驗證某種理論或者假設,這屬於基於語料庫的研究。研究者基本上會把語料庫看成是一種研究方法,而忽視語料庫語言學的學科地位,另外,他們會批評語料庫語言學研究只是單純的描述,缺少理論探索。這顯然是種偏見。但換個視角看,語料庫被廣大研究者使用,哪怕只是作為工具在使用,它的應用面越廣,越說明它有優勢,這樣,語料庫語言學才會有更多的發展機會。但是有一點值得我們反思,即應用性研究對於語料庫語言學本體研究會有什麼樣的啟發?

2.3 語料庫語言學與認知語言學是否可以交叉?

主張將語料庫語言學與認知語言學結合的學者給出如下解釋:兩者都有基於用法的語言觀,都以意義為語言研究對象,都反對傳統語法將詞彙和語法完全割裂的做法。從表面上看,語料庫語言學與認知語言學的確存在上述相似點,但仔細分析後發現,二者在語言觀與方法論上有著質的區別。首先,語料庫語言學始終堅持語言一元論。儘管認知語言學以用法為基礎,但更強調了概念的形成過程,這是一種典型的二元論。其次,意義的確是兩種語言學研究的核心,但對於認知語言學者而言,意義存在於使用者的大腦中,而對於語料庫語言學者來說,語義只能在語料庫中找到。認知語言學研究者不僅分析文本證據,而且要探索話語產生過程中整個大腦的過程,而語料庫語言學研究者只信任文本,共文中詞彙出現的頻數是研究意義的線索。最後,Sinclair(1991: 105)曾指出:「組合的深層單位是一種把意義與結構整合在一起的複雜體。」 這裡蘊含了一種短語學視角,該視角將詞彙與語法、意義與結構相互融合,最終放在一起進行描述。但認知語言學並不具有這樣鮮明的短語學視角。

2.4 語料庫統計方法是否越複雜越好?

目前語料庫統計研究呈愈演愈烈的趨勢,各種複雜的統計手段層出不窮。但是,Sinclair(2004)曾指出,語料庫研究使用統計不是目的,只是手段,不能夠盲目依賴各種複雜的統計方法。不可否認,使用統計方法,可以對大量數據進行處理,並且在某種程度上揭示了語言與其他元素潛在的關聯,這是僅依靠內省與語言直覺所無法辦到的。但是,統計的結果是一些數字和抽象的圖形,仍然需要研究者給予解釋,這難免會受到研究者語言學知識的影響,也會有一定的主觀臆斷性。語料庫語言學研究要立足於對語言文本的分析,以統計為輔助手段,主要還是觀察真實語言文本語境中呈現出的具有規律性的特徵,不能本末倒置,盲目追求統計方法的更新和複雜程度,而是找到恰當的統計方法,借用這些方法幫助研究者快速處理大批語言數據,捕捉到明顯的語言使用特徵。語料庫語言學分析最終還是要回歸到對語言文本的分析。

2.5 語料庫語言學研究範式是否適合非英語語言研究?

Sinclair(2004)曾開誠布公地講,他的研究是基於英語或者英語變體。那麼,從觀察描述英語語言而發展起來的語料庫語言學,其研究範式是否適合其他語言研究。換言之,語料庫語言學的研究範式是否具有普適性,一些重要的研究成果,是否適用於英語之外的其他語言研究。毋庸置疑,基於英語的語料庫語言學研究,對於非英語的語言研究極具參考價值,其研究理念和範式可以用於對其他語言的研究。但是,每種語言有不同於其他語言的特徵,基於不同語言的語料庫研究一定會有不同的發現。語料庫語言學否認普遍語法的存在,它的目的是要描繪出一套通用的語法理論,以適用於個別的語言描述,而非發展出一套普遍語法來解釋所有的語言。

相關焦點

  • 北京大學中國語言學研究中心CCL古代漢語語料庫
    北京大學中國語言學研究中心CCL古代漢語語料庫 2015年09月22日 11:47 來源:中國社會科學網 作者:語言學頻道綜合 字號 內容摘要:CCL語料庫由北京大學中國語言學研究中心
  • 專著推薦 | 許家金《語料庫與話語研究》
    在國際範圍內就成果數量和影響而論,語料庫在與話語研究的結合方面,成績最為突出。圖1.1所示為2006—2016年的十年間在國際期刊發表的語料庫研究熱點。其中discourse居於畫面正中,其所在的知識節點圓圈面積數倍於其他熱點關鍵詞,這反映出話語研究在語料庫研究中的影響和地位。
  • 語料庫研究學術源流考
    本文通過一手文獻,特別是新發現文獻,圍繞「用」「量」「器」「聚」四項設計特徵,考證語料庫研究的核心概念和理論源流。語料庫研究哲學背景深厚,語言學發展脈絡清晰,將其全然視作研究方法有悖史實。語料庫研究的演進與語言學發展史高度同步。20世紀上半葉可視作語料庫研究1.0時代,也可稱為前電子語料庫時代,它與(美國)結構主義語言學幾乎可以等同視之。
  • 大數據時代傳播研究中語料庫分析方法的價值
    新聞傳播學領域的研究面臨一個共同問題,即文本分 析方法的創新。基於大數據的分析思維,文本也是一種有巨大潛在價值的數據。但是傳統的文本分析手段拘泥於有 限的樣本數量和定性研究的窠臼,無法滿足大數據時代對 內容挖掘上廣度和深度的要求。在這種情況下,來源於應 用語言學領域的語料庫分析方法的介入,能夠使結構化文 本資料庫的構建成為可能。
  • 學術書摘 | 《語料庫與學術英語研究》(一)
    本書既有理論梳理、方法示範,又有趨勢探究與研究建議,具有學術性、前沿性、引領性,適合學術英語研究和語料庫語言學等領域的碩博研究生、年輕教師和研究者參考。緒   論第一章 語料庫與學術英語第二章 學術英語語料庫研究:功能與特徵第三章 學術英語語料庫研究:拓展與應用第四章 學術英語語料庫研究方法第五章 學術英語語料庫研究案例第六章 趨勢、展望與建議學術英語語料庫研究在應用語言學領域具有舉足輕重的地位,能夠滿足新時期英語教學和語言應用的需求,剖析學術交流語境中的英語語言特徵
  • 2019年語言學年度書單(50本)
    主要介紹文獻綜述,研究設計,文獻法、觀察法和個案法,調查法,實驗法,語料庫法,定量分析,定性分析,結果、討論和結論,研究論文的寫作,研究中的注意問題等內容,每章後面都附有相關的思考與練習,以供學生練習和讀者選用。同時,書後附有常用的統計參考值,以便讀者查詢。
  • 中國語言學研究70年
    改革開放帶來理論方法的引進和運用,在很多方面促進了中國語言文字研究範式的提升,尤其是功能—認知語言學、語法化學說、語言類型學、語言接觸等的研究範式已成漢語界的顯學,優秀成果不斷湧現,並反哺前沿理論。形式語言學也在一定範圍內得到深入研究。歷史語言學、地理語言學使漢語史研究和方言調查研究更具有系統性和多維性。
  • 詞彙語義的語料庫量化研究: 行為特徵分析法
    ,博士,博導,主要從事認知語言學、語料庫語言學、詞彙語義學研究。劉迪麟,男,美國阿拉巴馬大學英語系教授,博士,博導,主要從事語料庫語言學、語言教學、認知語言學研究。關鍵詞:行為特徵;詞彙語義;語料庫;量化分析語料庫研究法作為語言學的一種重要實證研究範式,被廣泛運用到語言研究的各個層面,而詞彙語義可能是使用語料庫研究方法最多的領域(Gries,2010:323)。語料庫語言學研究方法眾多,且各有所長。
  • 特別推薦 | 語料庫研究進展:學習者英語口語習得及局部語法
    畢業於北京外國語大學,獲外國語言學及應用語言學專業博士學位。研究方向為語料庫語言學、應用語言學。中國語料庫語言學研究會常務理事、中國高等教育學會外語教學研究分會理事、中國英漢語比較研究會外語教育技術專業委員會理事,全國中學通用教材《英語》(新標準初一至高三必修CD-ROM)核心編委,河南省教師教育專家,河南省中等職業教育師資培訓專家,河南省高級翻譯人才庫副召集人。
  • 語言資源與語料庫研究團隊系列講座之二:複雜動態系統理論在應用語言學研究中的發展現狀與方法展望
    (慶祝建校55周年)外國語言學及應用語言學研究中心系列學術活動——語言資源與語料庫研究團隊系列講座之二:複雜動態系統理論在應用語言學研究中的發展現狀與方法展望
  • 一款超級強大的兒童語音語料庫 語言學午餐
    CHILDES (Child Language Data Exchange System),兒童語言數據交流系統,也被稱為國際兒童口語語料庫,是在兒童語言研究相關領域被最廣泛使用的語料庫,有1000餘項基於該語料庫的研究成果發表( MacWhinney 2000)。
  • 基於語料庫的人民網對外傳播英文報導特點研究
    結合人民網對外傳播的問題,本文採用語料庫的研究方法,以人民網twitter帳號@PDChina傳播的人民網英文版文章為主體構建了研究語料庫。結合人民網對外傳播英文報導語料庫利用WordSmith Tools 5.0軟體進行了詞頻統計分析和共詞分析,總結了人民網對外傳播英文報導的5個特點,病探討了應用語料庫研究方法研究新聞文本的問題。
  • 近十年基於語料庫的語篇分析研究進展(四)
    三、基於語料庫的語篇分析研究發展趨勢 基於語料庫的語篇分析研究正呈現蓬勃發展的態勢,向更符合時代要求、更豐富和多元化的方向發展。(一)多媒體語篇分析研究出現多媒體和網際網路時代的到來,使音頻和視頻資料大量出現,建立能夠包含音頻和視頻資料的多媒體語篇語料庫成為發展趨勢。語料庫從收集文本語料階段發展到儲備口語語料階段,目前逐漸步入多媒體語篇的發展階段。
  • ​語料庫和牛津辭典——牛津英語語料庫(OEC)
    語言的研究基於真實證據。牛津辭典一直不斷地監控並研究英語是如何進化的,而語料庫分析就是達成此目的的核心,並為我們的語言研究提供真實的證據。語料庫(corpus)是什麼?語料庫是書面或口頭語言文本合集,並以電子形式展示。它提供證據展現真實場景下如何使用語言,幫助編輯們寫就準確和有實際意義的詞典條目。
  • 當前計算語言學發展的幾個特點
    隨著語料庫建設和語料庫語言學的崛起,大規模真實文本的處理成為計算語言學研究的主要戰略目標,基於語言大數據的經驗主義方法在計算語言學中獨佔鰲頭。理性主義方法的一個重要弱點表現在實踐方面。這樣,在計算語言學研究中就出現了應對大規模真實文本的問題。當前語料庫的建設和語料庫語言學的崛起,正是計算語言學戰略目標轉移的一個重要標誌。隨著人們對大規模真實文本處理的日益關注,越來越多的學者認識到,基於語料庫的分析方法(即經驗主義的方法)至少是對基於規則的分析方法(即理性主義的方法)的一個重要補充。
  • 2020年心理語言學研究熱點回顧
    然而,廣大研究者砥礪前行,促使心理語言學研究持續發展,並在新的情境下呈現出諸多研究熱點。一是語言標籤研究。語言具有「標籤」作用。在疫情期間給來自疫區的人們貼「標籤」,不僅不利於防疫,不利於病毒的溯源,還會使人聞之色變,產生恐懼、怨艾、歧視甚至憎恨等消極的心理效應。
  • 計算語言學研究70年(一)
    時至今日,圖靈測試的場景依然是計算語言學的主要研究對象,而研究方法則幾經變革。縱觀計算語言學研究方法的演化,我們可以將其歸納為規則、統計,以及深度學習三類。與此同時,計算語言學也經歷了從理性主義方法向經驗主義方法的演進,知識獲取的途徑由語言學家通過內省獲得,發展到由機器自動地從語料庫裡學習和提取。本文對新中國成立70年以來我國計算語言學的研究成果進行梳理。在國際計算語言學研究方法演化的大背景下,我國計算語言學的發展歷程,大致可以劃分為四個時期:漢字信息處理時期、規則時期、統計時期以及深度學習時期。
  • 多模態研究:認知語言學的新方法
    多模態研究:認知語言學的新方法 2017年09月12日 07:39 來源:中國社會科學網-中國社會科學報 作者:王中祥 字號 內容摘要:所謂多模態研究,是指通過多種技術手段記錄人際交流過程中不同類型的模態數據
  • KT微話題 | 語料庫+學術英語研究=?
    可見,學術英語研究自始便與語料文本和語言觀察結合在一起,並受益於語料庫。正如Hyland(2012:30)所言,「很難想到比學術英語研究受語料庫影響更大的應用語言學研究」。儘管學術英語和語料庫結合的研究已成為流行趨勢,但Ding & Bruce(2017)指出,評價一個研究方法是否適用於學術英語研究,需要考慮三方面問題:一是它會給學術英語研究提供什麼信息;二是它能夠如何提高學術英語範疇內的文本能力、體裁意識和社會語境知識;三是它涉及的語言學習理論能夠如何促進學術英語能力的提升。
  • 國外語言學學科眼動研究: 現狀與前瞻( 1934—2020)
    本文基於SSCI 資料庫收錄的語言學學科眼動研究文獻,梳理和歸納了該領域的發展脈絡、熱點演進、高被引文獻、代表性作者和核心主題,著重闡述眼動在語言習得的詞彙、句法和閱讀層面研究中的應用。文章最後就新文科背景下如何深化眼動技術應用以促進語言學研究發展提出建議。