摘要:目前國際上語料庫語言學研究具有什麼特點?有哪些研究熱點?又存在哪些爭議?為了回答這些問題,文章選取國際上具有代表性的語料庫專業期刊International Journal of Corpus Linguistics,述評該刊在2010~2019年十年間發表的所有文章,分析其研究內容,概括其特點,發現研究熱點,並在此基礎上就語料庫短語學、語料庫應用、語料庫與其他學科的交叉、語料庫研究中的統計方法、語料庫研究範式的普適性等系列問題展開探討,以期對國內從事語料庫研究的相關人員有所啟發。
關鍵詞:語料庫語言學;《語料庫語言學國際期刊》;語料庫短語學
1. 文獻述評
我們選擇其中具有代表性的International Journal of Corpus Linguistics(以下簡稱IJCL),分析該刊在2010~2019年十年間發表的所有研究性文章,歸納出如下六大研究熱點:
第一,學習者語料庫研究。比較對象更加多元化;除英語之外的其他語言的學習者語料庫研究也開始受到關注;在已有研究成果基礎上,開拓新的視角,進行學科交叉研究,或更新語料類型;跨學科交叉性研究備受青睞;不斷湧現新的統計方法;更加關注學習者語言的特殊性,針對學習者個體語料庫設計專門的標註、檢索軟體。
第二,基於語料庫的語類研究。語類的類型多樣,研究視角豐富,研究主要採用對比方法。
第三,語料庫建設和分析技術。關注非英語語料庫以及特殊用途語料庫的建設;大力發展口語語料庫建設;建設一些英語特殊語料庫;指出已有分析軟體和統計方法中存在的問題,並提出改進方案;介紹各種新開發的語料庫軟體;嘗試將不同的統計方法應用於語料庫研究。
第四,短語學研究。在已有短語學研究成果的基礎上進一步完善,或提出新的研究對象和術語;採用傳統的研究內容,更換新的語言材料,或者增加新的研究維度;將短語學研究與其他語言學研究進行交叉;非英語語言中的短語特徵。
第五,口語語料庫研究。IJCL在2017年有超過三分之二的文章是有關口語語料庫的研究,其中包括了BNC口語語料庫建設和研究特輯。特輯文章基於BNC口語語料庫,對口語語料進行了社會語言學的分析,其中包括性別、年齡以及其他社會語言學因素分析。其他幾篇口語研究涉及話語標記、非流利現象、詞束、學術口語、非英語類的口語話語、口語與手勢等研究內容。
第六,其他基於語料庫的交叉性研究。如,基於語料庫的批評話語分析研究、翻譯研究、社會語言學研究,以及其他類型的交叉研究和縱向的歷時性研究。
2. 問題與思考
2.1 語料庫短語學研究是否已「江郎才盡」,難出新意?
IJCL近十年持續不斷地發表短語方面的研究,但從研究內容和方法上來看,Sinclair所堅持的語料庫驅動的研究較少,更多的是與其他語言學科交叉性研究。此外,一些新的術語,如「詞彙框架」「搭配網絡」,並沒有引起多大影響。這不僅讓人產生疑慮:語料庫短語學是不是已經發展到頭了?研究者是不是已經「江郎才盡」,難以找到新的研究突破口了?然而,事實並非如此。我們通過研讀Sinclair的系列學說,發現他的短語思想一直在不斷地向縱深發展,其後期提出的一些重要思想是對前期思想的延續和發展,如意義移變單位、局部語法等,但這些重要思想尚未得到充分的闡釋和實踐證明,都將是未來語料庫短語研究的重要內涵。
2.2 語料庫的應用研究是促進還是抑制語料庫語言學的發展?
IJCL上發表了許多語料庫應用研究。這些研究有一共同特點,即把語料庫視為語言數據來源,用於驗證某種理論或者假設,這屬於基於語料庫的研究。研究者基本上會把語料庫看成是一種研究方法,而忽視語料庫語言學的學科地位,另外,他們會批評語料庫語言學研究只是單純的描述,缺少理論探索。這顯然是種偏見。但換個視角看,語料庫被廣大研究者使用,哪怕只是作為工具在使用,它的應用面越廣,越說明它有優勢,這樣,語料庫語言學才會有更多的發展機會。但是有一點值得我們反思,即應用性研究對於語料庫語言學本體研究會有什麼樣的啟發?
2.3 語料庫語言學與認知語言學是否可以交叉?
主張將語料庫語言學與認知語言學結合的學者給出如下解釋:兩者都有基於用法的語言觀,都以意義為語言研究對象,都反對傳統語法將詞彙和語法完全割裂的做法。從表面上看,語料庫語言學與認知語言學的確存在上述相似點,但仔細分析後發現,二者在語言觀與方法論上有著質的區別。首先,語料庫語言學始終堅持語言一元論。儘管認知語言學以用法為基礎,但更強調了概念的形成過程,這是一種典型的二元論。其次,意義的確是兩種語言學研究的核心,但對於認知語言學者而言,意義存在於使用者的大腦中,而對於語料庫語言學者來說,語義只能在語料庫中找到。認知語言學研究者不僅分析文本證據,而且要探索話語產生過程中整個大腦的過程,而語料庫語言學研究者只信任文本,共文中詞彙出現的頻數是研究意義的線索。最後,Sinclair(1991: 105)曾指出:「組合的深層單位是一種把意義與結構整合在一起的複雜體。」 這裡蘊含了一種短語學視角,該視角將詞彙與語法、意義與結構相互融合,最終放在一起進行描述。但認知語言學並不具有這樣鮮明的短語學視角。
2.4 語料庫統計方法是否越複雜越好?
目前語料庫統計研究呈愈演愈烈的趨勢,各種複雜的統計手段層出不窮。但是,Sinclair(2004)曾指出,語料庫研究使用統計不是目的,只是手段,不能夠盲目依賴各種複雜的統計方法。不可否認,使用統計方法,可以對大量數據進行處理,並且在某種程度上揭示了語言與其他元素潛在的關聯,這是僅依靠內省與語言直覺所無法辦到的。但是,統計的結果是一些數字和抽象的圖形,仍然需要研究者給予解釋,這難免會受到研究者語言學知識的影響,也會有一定的主觀臆斷性。語料庫語言學研究要立足於對語言文本的分析,以統計為輔助手段,主要還是觀察真實語言文本語境中呈現出的具有規律性的特徵,不能本末倒置,盲目追求統計方法的更新和複雜程度,而是找到恰當的統計方法,借用這些方法幫助研究者快速處理大批語言數據,捕捉到明顯的語言使用特徵。語料庫語言學分析最終還是要回歸到對語言文本的分析。
2.5 語料庫語言學研究範式是否適合非英語語言研究?
Sinclair(2004)曾開誠布公地講,他的研究是基於英語或者英語變體。那麼,從觀察描述英語語言而發展起來的語料庫語言學,其研究範式是否適合其他語言研究。換言之,語料庫語言學的研究範式是否具有普適性,一些重要的研究成果,是否適用於英語之外的其他語言研究。毋庸置疑,基於英語的語料庫語言學研究,對於非英語的語言研究極具參考價值,其研究理念和範式可以用於對其他語言的研究。但是,每種語言有不同於其他語言的特徵,基於不同語言的語料庫研究一定會有不同的發現。語料庫語言學否認普遍語法的存在,它的目的是要描繪出一套通用的語法理論,以適用於個別的語言描述,而非發展出一套普遍語法來解釋所有的語言。