論文分享│詞頻、語義和語言水平對英語搭配加工的影響

2021-02-07 北外人工智慧與人類語言實驗室

1、研究背景


搭配體現了詞與詞的句法語義共現關係,而搭配也是二語習得中公認的難點,即使高水平二語學習者在搭配上也會錯誤頻出、使用欠妥。學習者更容易掌握語義完全對等的高頻整體搭配,但如果成分詞的頻率更高,則會影響對整體搭配的掌握。心理語言學研究通過加工實驗嘗試探究一語語義和詞彙頻率對二語搭配的影響,目前未有一致結論。


該研究通過對比本族語者與中國 EFL 學習者對不同頻率(成分詞和搭配詞)的搭配合理性判斷結果,考差了語言水平、詞彙頻率和語義一致性對英語搭配加工的影響。

 

2、 研究問題


該研究對比了不同英語水平的中國學生與英語本族語者在英語搭配加工中受詞彙頻率、語義同譯和語言水平影響的情況。具體問題如下:

1)不同語言水平的中國EFL學習者和本族語者對語義(不)一致的搭配加工是否存在差異?

2)不同語言水平的中國EFL學習者和本族語者的搭配加工是否受單詞和搭配頻率影響?

3)語言水平、語義一致和詞彙頻率是否交互影響中國EFL學習者和本族語者對搭配的加工?

 

3、研究設計


實驗採用 2 × 2 × 3 的混合實驗設計。其中搭配類型(2個水平:同譯搭配、異譯搭配)和二語頻率(2個水平:單個詞頻、雙詞共現頻率)為被試內變量;被試的英語水平(3個水平:英語母語者組、EFL高水平組、EFL低水平組)為被試間變量。因變量是被試的反應時和準確率。

 

4、被試


英語母語者20人(11男9女,平均年齡26.5歲),均為美國舊金山州立大學的學生或教職人員,他們在接受實驗前都沒有學習漢語的經歷。


中國EFL學習者共79人參加實驗,實驗結束後填寫個人信息和語言水平自評問卷及VLT詞彙量測試。剔除了準確率低於75%的7名中國學生後,將其餘72名學生的VLT成績從高到低排序,選出最高和最低分段作為EFL高低兩個水平組,其中EFL高水平組30人(4男26女,平均年齡22.4歲),低水平組30人(4男26女,平均年齡20.6歲)。


所有受試的校準視力正常,無色盲,實驗後收到禮物作為報酬。

 

5、實驗材料


實驗材料選取了動-名、名-名和形-名3種搭配,每種搭配的同一個節點詞會有兩個不同的搭配詞,構成翻譯對等的同譯搭配和不對等的異譯搭配。例如,動-名搭配中的節點詞 break有一個同譯搭配 break a record(打破記錄)和一個異譯搭配 break a law(違法)。


實驗材料均經過英語專業學生的英-中翻譯測試和熟悉度評定,最終選出同譯搭配以及異譯搭配各60對,用交叉平衡法組建了2套實驗材料,另添加30對語義無關的單詞組合作為填充材料,受試隨機使用其中1套材料進行實驗。同譯、異譯、無關三組材料在節點詞詞頻、詞長、搭配詞詞頻、詞長、雙詞搭配詞長上均無顯著差異。

 

6、實驗程序


實驗開始後首先呈現一串紅色「*」注釋符,呈現時間為800ms,接著呈現66ms的空屏,然後目標詞組出現,持續4000ms。被試判斷英語詞組搭配是否合理,若合理按 J 鍵;否則按 F 鍵。之後進入下一個試次。中國學生實驗結束後完成個人信息填寫及詞彙量測試,本族語者在實驗結束後只填寫個人信息問卷。

 

7、研究結果


研究結果採用R語言混合效應模型為統計分析方法,反應時和準確率為因變量,分別用lmer()和glmer()函數建模。語義同譯、語言水平、節點詞頻、搭配詞頻和雙詞共現頻率為固定效應(自變量),受試和測試項目為混合效應模型的隨機因素。先分別構建反應時和準確率的簡單模型,再構建涵蓋所有因素及交互效應的複雜模型,最後採用LMERConvenienceFunctions軟體包進行逐步回歸分析,獲得擬合度最佳的模型。研究結果表明:

1) 本族語者和二語學習者對語義一致的同譯搭配的判斷更為準確,在反應速度上與判斷語義不一致的異譯搭配沒有顯著差異;

2) 學習者在搭配判斷上表現出隨語言水平提升,從對單詞詞頻和共現詞頻敏感到僅對共現詞頻敏感的趨勢,但兩種頻率的交互一直存在;

3) 學習者判斷無關搭配的反應速度顯著受到單個詞頻影響;判斷語義不一致搭配的準確度受單個詞頻制約但反應速度還受共現詞頻制約;低水平組只對單個詞頻敏感,而高水平組同時還表現出與搭配共現詞頻的顯著相關,語言水平、詞彙頻率與搭配的語義一致性存在交互效應。

 

8、總結


該研究對比分析了英語本族語者和中國英語學習者搭配加工中的詞彙頻率、語義一致和語言水平的影響。研究結果表明,二語學習者與本族語者的短語加工機制不存在質之別,而是量之差,且是從依賴單個詞的分解式與共現詞的整體加工的交互、共存與過渡;整體加工是終極目標,但由於心理詞庫中不同詞頻的共存,基於規則的分解與搭配組合的整體加工將攜手共進,此消彼長,交互制約著學習者的搭配習得與加工。

 

引用


張萍,方南(2020)詞頻、語義和語言水平對英語搭配加工的影響,《外語教學與研究》52(04):532-545+640。

相關焦點

  • 論文分享│熟悉度和語義透明度對英語二語複合名詞加工機制的影響
    導語:外語類核心CSSCI期刊《現代外語》於2020年1月發表了中國海洋大學陳士法教授等的研究論文「熟悉度和語義透明度對英語二語複合名詞加工機制的影響」。該研究採用詞彙判斷任務,對熟悉度和語義透明度如何影響英語二語者加工英語複合詞進行了研究。該文構建了中國學習者加工英語二語複合名詞的雙通道模型。
  • 詞頻對學習判斷的影響:信念和加工流暢性的貢獻(下)
    此外,我們還通過元記憶序列位置分析考察了詞頻對學習前的預JOL的影響。序列位置分析是通過計算四個連續序列位置(即位置1=單詞1-4,位置2=項目5-8等)的平均預JOLs來構建的。作為詞頻的函數,這一分析使我們能夠檢驗預JOL的詞頻效應是由任務過程中的經驗引起的,還是由信念引起的(Castel,2008;Tauber和Dunlosky,2012;Mueller等人,2014)。
  • 《Science》腦與語言特刊 | 組合句法和語義的神經基礎
    即使沒有語言輸入,大腦也會做一些相似的事情,它會根據我們的想法創造出新的意義並理解單個字詞。語義組合看似是本能、自動的,但事實上大腦在這過程中進行了相當複雜的活動。語言理解是語言加工的重要部分。在語言輸入時我們可以自動的調取長時記憶中的知識,但是在語言加工過程中,單詞組合的機制是什麼呢?如何評估組成的表述與語法知識之間關係的?
  • Science 語言和大腦特刊:大腦如何組合語法和語義?
    你有沒有想過,當脫口而出一句話的時候,大腦是如何把語義和語法組合在一起的呢?是大腦先計劃好了語義呢,還是先搜尋出了語法結構呢?又或者,語義和語法在大腦中是同時進行的?當我們說母語或者熟練的第二語言時,大腦會自動地把各個單詞組合成句子來理解。即使沒有語言輸入,我們的大腦也會不斷地產生新的想法。
  • 雙關語的語義通達模型及其認知神經加工特徵
    儘管當前雙關語認知加工的神經機制研究尚處於起步階段,在研究的深度和廣度上還遠遠沒有達到令人滿意的程度,然而從當前有限的研究中仍可看出,成功理解雙關語並體會其幽默效果的關鍵在於雙關語兩種詞義的成功通達和維持,其中最大的影響因素是語境和詞義使用頻率;在此過程中,左腦的語言加工優勢在前期起到了語言加工的主導作用,但在後期的語義—語境整合以及幽默體會等環節中,右腦也起到了至關重要的作用。
  • 哈工大 AAAI 2018 錄用論文解讀:基於轉移的語義依存圖分析 | 分享...
    本文介紹的工作來自哈工大 SCIR 實驗室錄用於 AAAI 2018 的論文《A Neural Transition-Based Approach for Semantic Dependency Graph Parsing》。在近期雷鋒網 GAIR 大講堂舉辦的線上公開課上,來自哈爾濱工業大學在讀博士生王宇軒分享了一篇他在 AAAI 2018 投中的論文:基於轉移的語義依存圖分析。
  • 詞頻分析研究的現狀、方法及工具,你值得擁有
    由上圖可知,以「詞頻」為主題的研究涉及多個學科,其中圖書情報與數字圖書館、計算機軟體及計算機應用這兩個學科方向對「詞頻」主題的研究較為關注;中國語言文學、外國語言文學、心理學、新聞與傳媒、網際網路技術、高等教育、教育理論與教育管理等學科方向次之
  • 新書推介:李梅秀 漢語作為第二語言搭配知識習得機制研究
    主要研究方向為漢語認知與習得,涉及漢語認知加工、漢語母語和漢語二語習得、少數民族多語習得等方面。曾主持或參加各類科研項目8項,目前主持1個教育部人文社科項目,發表各類論文7篇,代表性成果有「基於語料庫統計的『音-形』激活概率及加工機制」「漢語音節鄰域結構對母語者聽覺語音加工的影響」「中高級韓國學習者口語產出中動賓搭配的自然度考察」等。
  • 正字法深度對漢族、維吾爾族大學生漢字詞命名的影響
    整個研究表明, 正字法深度對兩個民族大學生的漢字詞命名的影響具有不同模式。所以如此, 與兩個民族的母語特點、詞彙獲得年齡、語言熟練程度和語言加工方式不同有關。關鍵詞 正字法深度; 詞頻; 語境; 維吾爾族1 前言中國是一個多民族國家。不同的民族有不同的語言。語言相通是民族間溝通的基本條件, 也是民族認同的重要前提之一。
  • 鄒炎炎:語義分析介紹及跨語言信息在語義分析中的應用 | AI 研習社...
    word embedding 是很常見的 input feature,能夠很大程度地提升語義分析模型的性能。然而,對於 output 對語義分析模型性能的影響,大家的關注度卻並不是很高。近日,在雷鋒網 AI 研習社公開課上,新加坡科學設計大學在讀博士鄒炎炎就用通俗易懂的語言為大家介紹了 semantic parsing 的概念、背景以及自己在該領域的論文成果,並介紹了關於 output embedding 對於 semantic parsing 的影響。
  • 「詞頻」分析:研究現狀、方法、工具與資源
    由上圖可知,以「詞頻」為主題的研究涉及多個學科,其中圖書情報與數字圖書館、計算機軟體及計算機應用這兩個學科方向對「詞頻」主題的研究較為關注;中國語言文學、外國語言文學、心理學、新聞與傳媒、網際網路技術、高等教育、教育理論與教育管理等學科方向次之
  • Science 語言和大腦特刊:大腦如何組合語法和語義?跨學科的合作帶來了驚喜
    又或者,語義和語法在大腦中是同時進行的?當我們說母語或者熟練的第二語言時,大腦會自動地把各個單詞組合成句子來理解。即使沒有語言輸入,我們的大腦也會不斷地產生新的想法。儘管組合語義是我們的本能行為,但是實際上大腦在產生語言時做一些相當複雜的加工過程。
  • 「詞頻」分析研究現狀、方法、工具與資源
    它是文獻計量學中傳統的和具有代表性的一種內容分析方法,基本原理是通過詞出現頻次多少的變化,來確定熱點及其變化趨勢。以中國知網全文資料庫(期刊)為檢索對象,以「篇名」為檢索條件,在334篇論文題目中出現「詞頻」二字,其中40篇核心期刊;如果以「主題」為檢索條件,則有2343條文獻以「詞頻」為主題開展了研究,其中1200多篇在核心期刊發表。
  • 淺析英語科技論文的語言特點
    而科技論文作為科技交流的重要方式,其英語形式的使用需要也在相應擴大。為了準確、全面解釋英語科技論文所表達的內容,應掌握客觀性、真實性、合理性、嚴謹性等特點,同時,還應注意前後文的有序銜接。賽恩斯編譯通過分析歸納認為,英語科技論文的語言特點主要體現在詞彙、句法以及句型等方面。一、基本特點。
  • 淺析英語科技論文的語言特點
    科技論文作為國際間科技學術交流的重要方式,其英語形式的使用需要也在隨著科學技術發展進步的同時相應擴大。為了準確、全面解釋英語科技論文所表達的內容,賽恩斯編譯認為,應掌握客觀性、真實性、合理性、嚴謹性等特點,同時,還應注意前後文的有序銜接,英語科技論文的語言特點主要體現在詞彙、句法以及句型等方面。
  • 《中國失語症語言評估量表》的設計原理
    在命名和語法錯亂的失語症中,及物動詞比不及物動詞表現出更多命名障礙。PPA語法錯亂亞型病人也存在相同模式。       1.1.4 詞頻對命名的影響 詞頻對失語症命名有影響。有研究報告了58名義大利失語症患者中有11名表現出詞頻影響其名詞和動詞命名,且與失語類型無關,對詞頻敏感的11名被試包括忘名症、威爾尼克和語法錯亂的失語症患者。
  • 詞頻對學習判斷的影響:信念和加工流暢性的貢獻(上)
    他們獲得了課程要求的部分學分或禮物(如筆記本和鋼筆)。實驗設計被試內部唯一的變量是詞頻(高詞頻與低詞頻)。實驗材料本研究選取了《現代漢語詞頻詞典》中的158個漢語詞彙作為研究對象。我們要求31名獨立評分員按照筆畫數、習得年齡(7分制,1=0-2歲;7=13歲及以上)、熟悉度(5分制,1=非常陌生;5=非常熟悉)和具體性(5分制,1=非常抽象;5=非常具體)對單詞進行編碼。在平衡這些維度的基礎上(PS>0.05),我們最終選擇了16個高頻詞(每百萬次出現185次到603次)和16個低頻詞(每百萬次出現8次到9次)。
  • 譚景春:語義理據對選取異形詞推薦詞形的重要性——以「畢恭畢敬—必恭必敬」「翔實—詳實」為例
    本文主要討論語義理據,語義理據主要是指語素義和詞義相吻合(參看《一異表》),並以「畢恭畢敬—必恭必敬」和「翔實—詳實」兩組異形詞的詞頻變化來說明語義理據對選取異形詞推薦詞形的重要性。下面分別對「畢恭畢敬—必恭必敬」和「翔實—詳實」進行討論。《〈第一批異形詞整理表〉說明》(以下簡稱《說明》)指出:「『必恭必敬』這一成語,出自《詩·小雅·小弁》:『維桑與梓,必恭敬止。』
  • 齊夫定律:描述詞頻分布規律的強大數學工具
    後來,經過學者們的多次修正和改進,齊夫定律有了更為精確的表述和更為廣泛的應用。例如,「分形幾何之父」曼德布羅特(B. Mandelbrot)於1952年對該定律進行了修訂,增加了幾個參數,使其更符合實際的情形。  齊夫定律表明:在英語單詞中,只有極少數的詞被經常使用,而絕大多數詞很少被使用。實際上,包括漢語在內的許多國家的語言都有這種特點。
  • 思維定勢對醫學論文摘要漢譯英的影響
    思維定勢,又稱慣性思維,是認知主體按照自己固有的知識、經驗、觀念、方法思考分析問題的模式,表現為在解決問題過程中作特定方式的加工準備。醫刊彙編譯發現,中國作者根植於中國文化,在英文寫作中通常會受到由此引起的思維定勢的影響。因此,以下對思維定勢碰撞在醫學論文英文摘要寫作中的幾種典型表現以及極易被中國作者忽略的幾個最具共性的語言問題進行闡述。