選自duolingo
作者:Bill McDowell、Burr Settles
機器之心編譯
參與:高璇、Geek AI
隨著人工智慧發展逐漸進入「深水區」,越來越多的研究者把目光投向了使用人工智慧增強人類智能的研究領域。近日,語言學習平臺 Duolingo 針對歐洲語言共同參考框架(CEFR)推出了 CEFR 檢測器,能夠自動為不同層次的語言學習者提供同級學習文本改寫服務。
「對!——我神經過敏,非常,非常過敏,十二萬分過敏,過去是這樣,現在也是這樣;可您幹嗎偏偏說人家瘋了呢?犯了這種病,感覺倒沒失靈,倒沒遲鈍,反而敏銳了。尤其是聽覺,分外靈敏。天上人間的一切聲息全都聽見。陰曹地府的種種聲音也在耳邊。那怎麼是瘋了呢?聽!瞧我跟您談這一切,有多精神,有多鎮靜」。
這是埃德加·愛倫·坡(Edgar Allan Poe)小說《洩密的心》(The Tell-Tale Heart)中一個神經過敏的角色的內心獨白,它以一種讓人仿佛身臨其境的感覺開頭,吸引了廣大的讀者,也為我們提供了向「多鄰國」(Duolingo)語言學習故事的讀者展示的引人入勝的素材。但是對我們的學習者來說,英語常常是他們的第二語言,因此我們努力將這種材料改編成更簡單的形式,同時又保留其核心內容。例如,我們可以將以上段落重寫為以下文字,以供英語初學者閱讀學習:
「對!——我神經過敏,但我瘋了嗎?犯了這種病,聽覺感覺反而敏銳了。天堂人間地獄的一切聲息都可聽見。那怎麼是瘋了呢?聽!我能跟您談論這一切」。
這項文本改編任務對我們來說是一個艱巨的挑戰,即如何有效地為各個階段的學習者生成可學內容——不僅是我們的語言學習故事,還包括播客和「多鄰國」產品的其它功能。因此,我們構建了半自動的機器學習系統,以幫助我們針對於不同的語言熟悉程度進行的內容創建過程(根據 CEFR 標準進行衡量)。值得一提的是,我們已構建了 CEFR 檢測器(Checker)來幫助實現語言轉換,並且檢查跨語言的內容是否適合初學者、中級學習者和高級學習者。在這裡,我們也會將這個工具提供給語言教育者和公眾!下面將詳細介紹其用途和使用方法。
CEFR 和 CEFR 檢測器
歐洲語言共同參考框架(Common European Framework of Reference,CEFR)是一種語言熟練程度標準,根據學習者的語言能力將其分為初學者、中級學習者和高級學習者。這些級別通常被細分為 A1、A2、B1、B2、C1 和 C2,與上圖所示的不同熟練程度相對應。根據「Can do…」的句式等評估學習者在聽力、閱讀、寫作和口語交際能力方面的水平。這些語句的範圍從「可以理解並做出基本的問候」(初學者水平)一直到「可以寫出關於複雜主題的結構良好的詳細文本」(高級水平)。
有了 CEFR 標準,我們可以將改寫任務視為:將一段中級學習者(例如 B1)可以理解的文本修改為內容相同的文本,同時初學者(例如 A1 或 A2)可以理解這段修改後的文本。有時,我們甚至需要把 A2 級別的文本改寫為 A1!這通常需要將語言的詞彙、語法或習慣用語以及與文化相關的各個方面簡化為不同級別的學習者更容易理解的形式。我們的 CEFR 檢測器通過評估 CEFR 等級來輔助此過程,檢測器將測試學習者可以在哪個 CEFR 等級下,理解改編文本中的每個單詞。例如,下面的截圖展示了該工具如何將原始愛倫·坡原文的一些單詞評估為 C1 或 C2 級別(紅色高亮表示),並在簡化文本中將最高級的單詞(「nervous」)評估為 B1 級別(橙色高亮表示)。
該工具提供了數十萬個英語、西班牙語、法語、義大利語、德語和葡萄牙語單詞的 CEFR 評估值,我們今天將發布其中兩種語言(英語和西班牙語)的公開版本!通過利用下文描述的人工智慧機器學習模型,我們可以提供海量的詞彙表和多種語言的評估值。
人工智慧的部分
CEFR 檢測器中的彩色文本可視化結果取決於多種語言中成千上萬個單詞的 CEFR 等級——如果我們的課程專家進行手工標記,成本將極其高昂、令人抓狂。我們通過使用數千個人工標註的 CEFR 英語、西班牙語和法語單詞標籤訓練一個機器學習系統,並使該模型可以泛化到許多其它語言的數十萬個單詞上,最終降低了成本。這種有序回歸學習模型將考慮一個單詞及其源語言,並預測該單詞的目標學習者的 CEFR 等級(A1、A2、B1、B2 或 C)。
我們使用遷移學習和領域自適應技術,同時依靠與語言無關的特徵將模型泛化到新的語言上。也就是說,模型中的特徵包括多語言單詞嵌入(MWE)和通過電影字幕估計的單詞語料庫頻率。MWE 將單詞映射到一個 300 維的空間中,在這個空間中,出現在多語言的語料庫中的相似特徵和語義上下文中的單詞會距離較近,從而提供了語言無關的單詞「含義」的表徵,簡化後的三維空間如圖所示
CEFR 往往要求依賴於某些主題下的語義信息的交際能力(例如,一個人是否可以在涉及問候、個人生活、食物、家庭的「日常」環境中進行交互),因此這些 MWE 和語料庫頻率直觀上看是符合客觀事實的。此外,我們還希望可以做這樣的安排:讓學習者先學習常見的語言形式,然後學習不常用的語言形式。
為什麼要使用人工智慧技術呢?為什麼不簡單地將 CEFR 英語單詞表翻譯成其他語言呢?不妨設想一下,在英語環境中,我們說「I am hungry」,而西班牙語中會說「tengo hambre」(字面意思是「我餓了」)。這兩種表達都是 A1 級。但是,如果將這些表達形式逐字地翻譯為另一種語言,則最終會得到西班牙語形容詞 hambriento(對應英文「hungry」)或英語名詞「hunger」(對應西班牙語「hambre」),它們實際上都是 B1 級單詞。除此之外,語言之間慣用語表達的不匹配使我們很難簡單地翻譯單詞表。我們發現,我們對詞頻和語義建模的方法可以幫助我們做得更好。
結語
CEFR 檢測器是我們目標語言多樣、熟練程度不同的學習者改寫文本內容的過程中的一個關鍵部分。我們希望它的發布能對其它課程開發人員構建「多鄰國」以外的語言學習資源有所幫助,並希望它的存在能進一步促進 NLP 和機器學習研究,從而催生更多增強類似工具的應用程式。
參考連結:https://cefr.duolingo.comhttps://making.duolingo.com/the-duolingo-cefr-checker-an-ai-tool-for-adapting-learning-content