以大量實驗研究為基礎,中國科學院行為科學重點實驗室李興珊研究員構建了中文閱讀過程中認知加工的計算模型(中文閱讀模型,簡稱CRM),成果發表在《Psychological Review》上。
為較全面地研究中文閱讀機制,CRM整合了中文閱讀過程中的詞彙加工和眼動控制兩大模塊。詞彙加工模塊使用交互激活框架來模擬詞彙加工過程;眼動控制模塊則利用詞彙加工模塊提供的字詞激活信息來決定眼睛移動時間和位置。由於中文文本中沒有詞間空格,CRM對中文閱讀中的詞切分問題提出了一系列原創性的假設:即詞彙加工模塊在注視點周圍的閱讀知覺廣度範圍內獲取新信息,從而激活知覺廣度範圍內的漢字可以組成的全部詞彙,並相互競爭;當一個詞在競爭中勝出後,該詞即被識別同時完成了詞切分。基於這些假設,CRM可以將句子中的連續漢字切分成詞,並在句子閱讀中進行識別。針對眼動控制,CRM採用研究團隊提出的基於加工的眼動落點選擇策略:在一個注視點,讀者儘可能多地加工可以看到的字,然後下一次眼跳落在已經識別的字的後面。這樣該模型很好地解釋了詞彙識別與眼動控制的關係。CRM成功地模擬了以往研究中所揭示的關於中文閱讀中詞彙加工和眼動控制之間關係的主要發現,並解釋了中文讀者如何進行眼跳目標的選擇、如何切分歧義欄位、以及如何利用副中央凹視覺區進行信息加工等問題。 CRM解決了中文詞在缺乏詞間空格的情況下如何實現識別和切分以及如何控制眼動的難題,對揭示中文閱讀加工的獨特性與人類閱讀加工的一般性具有重要意義。研究中文閱讀的獨特性有助於回答現有的拼音文字閱讀模型無法回答的問題,比如CRM重點關注的「中文讀者如何確定詞邊界」的問題在拼音文字閱讀中並不存在。關於此問題的研究也已經開始定義和塑造一些有關人類書面語言理解的關鍵問題。此外,CRM的建立也為解決自然語言處理領域中的中文分詞等關鍵問題提供了科學依據。上述建模工作是在李興珊研究員帶領的閱讀與視覺認知實驗室十餘年來開展的一系列針對中文閱讀中的認知機理進行研究工作的基礎上完成的。相關研究先後得到國家自然科學基金面上項目(31970992,31571125,31070904)、自然科學基金委重大國際合作項目(61621136008),以及中國科學院知識創新工程重要方向項目的支持。論文信息:
Li, X., & Pollatsek, A. (2020, July 16). An Integrated Model of Word Processing and Eye-Movement Control During Chinese Reading. Psychological Review. Advance online publication.
http://dx.doi.org/10.1037/rev0000248