Psychological Review | 心理所構建中文閱讀的認知計算模型

2021-02-19 中科院心理所
中文是中華民族的寶貴財富,是全球近四分之一人口的母語,更是凝聚全球華人的重要紐帶。對中文閱讀的認知機理進行研究,並使其更好地為中文閱讀者服務,具有重要的理論與實際意義。與英文等拼音文字相比,中文具有很多鮮明的特點。其中一個顯著特點是中文文本在詞和詞之間沒有空格,這使得現有的閱讀模型面對中文時都無能為力。

以大量實驗研究為基礎,中國科學院行為科學重點實驗室李興珊研究員構建了中文閱讀過程中認知加工的計算模型(中文閱讀模型,簡稱CRM),成果發表在《Psychological Review》上。

為較全面地研究中文閱讀機制,CRM整合了中文閱讀過程中的詞彙加工和眼動控制兩大模塊。詞彙加工模塊使用交互激活框架來模擬詞彙加工過程;眼動控制模塊則利用詞彙加工模塊提供的字詞激活信息來決定眼睛移動時間和位置。由於中文文本中沒有詞間空格,CRM對中文閱讀中的詞切分問題提出了一系列原創性的假設:即詞彙加工模塊在注視點周圍的閱讀知覺廣度範圍內獲取新信息,從而激活知覺廣度範圍內的漢字可以組成的全部詞彙,並相互競爭;當一個詞在競爭中勝出後,該詞即被識別同時完成了詞切分。基於這些假設,CRM可以將句子中的連續漢字切分成詞,並在句子閱讀中進行識別。針對眼動控制,CRM採用研究團隊提出的基於加工的眼動落點選擇策略:在一個注視點,讀者儘可能多地加工可以看到的字,然後下一次眼跳落在已經識別的字的後面。這樣該模型很好地解釋了詞彙識別與眼動控制的關係。CRM成功地模擬了以往研究中所揭示的關於中文閱讀中詞彙加工和眼動控制之間關係的主要發現,並解釋了中文讀者如何進行眼跳目標的選擇、如何切分歧義欄位、以及如何利用副中央凹視覺區進行信息加工等問題。      CRM解決了中文詞在缺乏詞間空格的情況下如何實現識別和切分以及如何控制眼動的難題,對揭示中文閱讀加工的獨特性與人類閱讀加工的一般性具有重要意義。研究中文閱讀的獨特性有助於回答現有的拼音文字閱讀模型無法回答的問題,比如CRM重點關注的「中文讀者如何確定詞邊界」的問題在拼音文字閱讀中並不存在。關於此問題的研究也已經開始定義和塑造一些有關人類書面語言理解的關鍵問題。此外,CRM的建立也為解決自然語言處理領域中的中文分詞等關鍵問題提供了科學依據。上述建模工作是在李興珊研究員帶領的閱讀與視覺認知實驗室十餘年來開展的一系列針對中文閱讀中的認知機理進行研究工作的基礎上完成的。相關研究先後得到國家自然科學基金面上項目(31970992,31571125,31070904)、自然科學基金委重大國際合作項目(61621136008),以及中國科學院知識創新工程重要方向項目的支持。

論文信息:

Li, X., & Pollatsek, A. (2020, July 16). An Integrated Model of Word Processing and Eye-Movement Control During Chinese Reading. Psychological Review. Advance online publication. 

http://dx.doi.org/10.1037/rev0000248

相關焦點

  • 生物學教學中構建認知模型對科學思維發展的作用
    構建科學認知模型發展學生科學思維生物學是研究生命現象及生命活動規律的科學。生命存在的物質形式即為生命現象,如生命系統的結構及功能等;而生命存在的非物質形式即為生命現象中蘊含著的生命活動規律,如遺傳的基本規律、進化理論等。生命現象的研究多採用分析與綜合,生命活動規律的探索主要依賴歸納與演繹。
  • 冥想對認知和總體幸福感的影響
    在輕度認知障礙(MCI)患者中,一項研究表明,冥想可以改善認知,並報告了正念[4]。另一項針對MCI或中度阿爾茨海默病患者進行了八周的基爾坦·克裡亞冥想(Kirtan Kriya)研究,這項研究使用一系列聲音的冥想技術,改善了認知[5]的某些方面。然而,第三項針對MCI患者的研究表明,正念冥想並不能改善認知[6]。然而,所有這些研究都是小規模的,患者不到20人。
  • [上篇]ANNUAL REVIEW OF PSYCHOLOGY
    This guidedescribes how to plan, conduct, organize, and present a systematic review ofquantitative (meta-analysis) or qualitative (narrative review, meta-synthesis)information.
  • 計算認知神經科學:試圖理解人類複雜行為背後存在基本的數學原理
    具體而言,認知科學發展出把複雜的認知過程分解成計算組件的計算模型;計算神經科學模擬了神經元之間的動態交互(實現各計算組件的功能);人工智慧展示了如何組合各組件功能來創建智能行為。我們知道,要建立能夠執行認知任務且能解釋大腦信息加工過程的計算模型,最大的挑戰在於如何建立理論(實例化的計算模型)和實驗(提供腦和行為數據)之間穩固的「橋梁」。
  • 基於R的生存資料預測模型構建與Nomogram繪製
    大多數時候我們會根據患者的臨床分期告訴患者,這種情況的中位生存時間是多少……其實這裡的臨床分期就是我們預測患者期望壽命的依據,或者如本文標題所說的「預測模型」,我們用某一臨床分期的所有患者中位生存時間來回答單個患者的問題,可能會存在問題,這裡的中位生存時間代表的是患病人群預期壽命的平均值,對於具體的個體來說有時並不準確。那我們是否有更科學、更準確的方法計算出單個患者的生存概率?
  • Book Review是什麼?Book Review怎麼寫?
    Book review是大學裡一種非常常見的寫作類型, 但是很多同學都因為不會寫書評book review而苦惱。有些學生是因為沒有寫作能力,另一部分是因為不喜歡閱讀。大部分的學生是因為對書評book review怎麼寫存在許多的疑問。很多是因為不了解書評寫作順序而煩惱。
  • 首發| 中文少兒分級閱讀平臺考拉閱讀獲2000萬美元B輪融資
    閱讀理解、寫作的廣度難度增加,語文核心素養要求提升,也就意味著學生長期的閱讀積累將會直接影響語文成績。一、什麼是分級閱讀?為何重要?分級閱讀是指是按照學習者不同年齡段的智力水平、心理髮育程度,以及語言水平而專為學習者提供的科學閱讀計劃,為不同水平的學習者提供有針對性的讀物。
  • 人工智慧、機器學習及認知計算初學者指南
    在過去十年裡,認知計算開始出現,該技術旨在構建可以學習且能夠與人類進行自然交互的系統。在電視競賽節目 Jeopardy! 上,IBM Watson™ 擊敗了世界級的對手,展示了認知計算的獨特能力。艾倫·圖靈向我們展示了任何計算均可通過數位化的方式實施。之後,這種構建能夠模擬人類大腦的理念並未有太大發展。較早期的研究主要專注於強人工智慧,但在這一時期所引入的概念構成了當今所有機器學習與深度學習算法的基礎概念。
  • ...計算機科學、神經科學,看中國中文信息學會2017學術年會如何...
    在未來,也存在很多很大的挑戰,例如怎麼讓人機合作(心理學部分很重要),如何解決系統的操作,如何應對魯棒挑戰等。傅小蘭研究員:感知、記憶和判斷的認知計算模型(PMJ模型)在翟成祥教授的報告結束之後,傅小蘭研究員帶來了題為《感知、記憶和判斷的認知計算模型(PMJ模型)》的報告。
  • 百度王海峰出席中國認知計算和混合智能學術大會 深度解析「多模態...
    8月25日,為期兩天的首屆中國認知計算和混合智能學術大會(CCHI2018)在西安舉辦,百度高級副總裁、AI技術平臺體系(AIG)總負責人王海峰與中國科學院院士陳霖、蒲慕明等學界知名專家共同研討與交流認知科學、神經科學與人工智慧學科領域交叉融合的最新進展和前沿技術。
  • 三層次統計物理模型為定量計算物質特性參量構建了切實可行的平臺
    由于吉布斯系綜理論未能解答「統計物理學處理互作用粒子系統所遇到的困難」問題,所以應用吉布斯系綜理論不可能導出用簡潔數學語言描述的具有準確定量功能的物態方程.、簡化為由三個層次構成的統計物理模型:1 .力的特性,從而化解了「統計物理學處理互作用粒子系統所遇到的困難」問題.
  • 獨家 | 教你使用torchlayers 來構建PyTorch 模型(附連結)
    torchlayers 旨在做Keras為TensorFlow所做的事情,它提供了更高級的模型構建的API和一些方便的默認值以及附加功能,這些功能對構建PyTorch神經網絡很有用。通過在線搜索的趨勢判斷(連結:https://trends.google.com/trends/explore?
  • 思想實驗 | 中文房間:機器能否具有心智?
    由於屋內人有一本完美的規則書,他可以在保持絲毫不懂任何中文的狀態下按照規則書的指導正確選擇並組合漢字卡片,並流暢地回答該問題。由此,屋外的人有足夠的理由相信屋內所住的是一個通曉中文的人。「中文房間」這一實驗實際在模擬一段電腦程式,即輸入一段中文字符(向屋內送問題紙條),通過運算(屋內人查找規則書),再輸出另一段中文字符(屋內人送出回答紙條)。因此本質上,塞爾提出的是一個有關於人工智慧判斷標準的模型。
  • 神經、認知、計算三學科深度交叉 建開源開放平臺探索人工智慧...
    神經、認知、計算三學科深度交叉建開源開放平臺探索人工智慧「無人區」目前,大數據+深度學習+大算力構成了人工智慧的主要發展模型,但更多的數據、更強的算力和改進的算法卻未必會讓人工智慧更聰明。有專家指出,人工智慧未來發展的關鍵並不是簡單提高算力和增加數據,而是要重新思考智能模型。
  • Review詳情,你知道多少?
    從亞馬遜平臺我們可以得到一個簡單解釋:亞馬遜review星級的評級不是通過原始數據的平均值進行計算的。 Review星級的評級是根據自身機器人的學習模型計算產品的。 學習模型考慮的因素包括評級的年限、評級是否來自已驗證的購買者、以及評論是否提供幫助這三個直觀因素。 也就是說,我們不能用以往的經驗來做星級評價的簡單判斷。
  • JAMA:社區災難發生之後心理援助的重要性
    「重大災難所造成的精神及身體上的後果需要得到有效的社區響應,這已經得到了越來越多的關注。據估計,美國人口中的大多數會在他們的一生中接觸到一種...自然災難;如果在這一估計值之上再加上諸如飛機墜毀等技術性事件及諸如恐怖主義等蓄意的人為事件,那麼就會估算出更高的數字。接觸災難帶來的精神衛生影響與為所有創傷形式的倖存者提供治療是相關的。」
  • 營養與健康所等開發新的定量蛋白質組數據差異分析計算模型
    」,報導了一種新計算模型MAP,用於統計分析基於同位素標記產生的定量蛋白質組數據並鑑定其中差異表達的蛋白質。這類數據已有的差異表達分析方法大多依賴於對並行或已有的技術重複數據進行前期比較來構建實驗的技術誤差模型,並以它為基礎檢驗每個蛋白質在被比較樣本之間表達差異的統計顯著性。該方法佔用了有限的實驗通道,也難以保證誤差模型的精確適用性。
  • 今日Paper|可視問答模型;神經風格差異轉移;圖像壓縮系統;K-SVD...
    圖像去噪神經閱讀理解與超越準確性與複雜性:可視問答模型中的一種權衡論文名稱:Accuracy vs.現有VQA模型的關鍵是將圖像的視覺特徵與給定問題的語義特徵相結合而學習到聯合嵌入。大量的研究聚焦於利用視覺注意力機制來設計複雜的聯合嵌入策略,以有效捕捉視覺與語義間的交互作用。但是,在高維空間構建視覺與語義特徵計算量極大,模型越來越複雜,對VQA準確率帶來的提升卻很小。這篇論文系統地研究了模型複雜度和性能兩方面的折中策略,並且特別關注了這些模型在多模態融合方面的效果。