發愁不會輔導英文作文?這有個AI想幫你搞定

2021-01-21 品玩

如果有一個人工智慧英語老師,不僅能隨時給你的英語作文打分,而且還可以給出改進建議,是不是很妙?

近日在微信公眾號平臺上線的一款名為「愛寫作」的產品,就提供了這樣的功能,PingWest品玩和它背後的微軟開發團隊聊了聊,聽他們講了講這個人工智慧老師究竟是如何工作的。

AI 批改英文作文效果幾何?

首先我們來通過例子來看看它的具體表現如何。

「愛寫作」的功能分為 3 塊,分別是作文打分、語法糾正和詞語替換。

這項服務最早可追溯到 2018 年,微軟亞洲研究院開發的英語學習服務「微軟小英」,上線作文打分功能。2019 年 12 月,微軟將其升級之,並命名為「愛寫作」,首先在網頁端上線。

我們以一篇高三英文作文為例,看看「愛寫作」的實際效果。

通過右邊檢查結果,可以清晰看到,這篇英文作文在高考評分標準下,拿到了 24 分(滿分 25 分)。有 5 處語法錯誤,建議替換 12 處。

打分模塊不僅只呈現一個數字,還給出了所衡量的維度。

「愛寫作」能根據不同考試類型來打分,用戶在批改前可自行選擇。眾所周知,每個學段考試,對應總分是不一樣的。比如高考英語作文滿分是 25 分,六級是 106.5 分,而雅思是 9 分。

而在語法層面,錯誤基本能檢查出來,比如 AI 識別「we would sure die」應改為「we would surely die」。

AI 識別「eat in a health way」應改成「eat in a healthy way」。

除了語法糾正,「愛寫作」還能通過詞語替換來潤色作文。詞語替換是指,機器給出更高級的用詞建議,由用戶決定要不要替換。

比如下面這個例子,「愛寫作」給出的建議是「connections」替代「contacts」,組成「social connections」。

AI 是怎麼改英文作文的?

在作文打分上,「愛寫作」採用了微軟亞洲研究院研發的序數回歸模型。

據微軟亞洲研究院文章,作文打分是一種主觀行為,要轉化為機器打分,需要大量有標註的數據,而序數回歸模型大大減少了對標註數據量的依賴。

這項技術把「文章與具體分數的匹配」問題,變成了一個有序的比較大小的問題。

在訓練過程中,將已有的標註數據兩兩配對進行對比,進而形成新的文章與評分,再將此數據加入到標註數據集中,使得可用於訓練的標註數據量呈指數級增加,從而整體提高了評分的準確性。

(作文打分的方向和維度)語法糾正方面,「愛寫作」同樣用到了微軟原創的模型。

「語法糾正和機器翻譯在技術上有一定相似性。」微軟亞洲研究院資深開發經理夏炎介紹,「不管是用戶寫的文章,還是機器翻譯出來的,都要判斷這個句子的語法正確性和語言流暢度。」

早在 2018 年 8 月,微軟亞洲研究院就發表文章,介紹了一種用於語法糾正的全新學習和推斷機制——「流暢度提升學習與推斷」(Fluency Boost Learning and Inference)。

該機制基於自然語言處理領域非常流行的 seq2seq 模型。據微軟亞洲研究院文章,對於一個用於語法改錯任務的 seq2seq 模型,其基本的訓練數據為,一個原始句子和正確句子所組成的改錯句對,如下圖(a) 所示。

從理論上講,只要有大量的訓練數據,就能得到一個相對完美的語法改錯模型。

然而實際上,這種改錯句對的數量規模相當有限。「我們在做 AI 模型研究時,第一個困難就是訓練數據和樣本的生成及獲取。」夏炎說。

因此,在訓練數據並不充足的情況下,seq2seq 模型泛化能力會受到影響,導致哪怕輸入的句子稍稍變動一點,模型也可能無法將其完全改正,如上圖 (b) 所示。

此外,對於一個含有多個語法錯誤的句子,單次的 seq2seq 推斷往往不能完全將其改正。在這種情況下,需要用多輪 seq2seq 推斷來對一個句子反覆修改,如上圖 (c) 所示。

為了改進 seq2seq 模型的不足,微軟亞洲研究院提出了「流暢度提升學習與推斷」機制。這一機制可細分為兩部分,分別是「流暢度提升學習」和「流暢度提升推斷」。

「流暢度提升學習」是指在訓練模型的過程中,讓 seq2seq 模型生成多個結果,然後將流暢度不如正確句子的生成句子,和正確句子配對,組成全新的流暢提升句對,作為下一輪訓練的訓練數據。

「中間這些結果都是機器自動生成的,有的流暢度很高,有的流暢度很低。」夏炎說,「我們可以把流暢度低於最終結果句子都拿過來作為訓練樣本。這樣數據收集工作就大大減輕了,是一個很有意義的改進。」

「流暢度提升推斷」則是利用 seq2seq 模型對句子進行多輪修改,直到句子流暢度不再提升為止。

這種多輪修改策略能夠率先改掉句子一部分語法錯誤,從而使句子上下文更加清晰,有助於模型修改剩下的錯誤。

像下圖的例子裡,機器會先把第一句改成第二句,把「is catched」換成了「caught」,有一定進步,但還沒使得整個句子的語法完全一致,因為後面還有「last night」,需要把主語時態「sees」改成「saw」。

經過第二次修改後,結果已經沒有毛病,但機器還會進行第三次修改。改完後,句子流暢度已經沒有新改變。

「這個時候我們可以認為,語法糾正的流程結束了。」夏炎說,「這其實也是人在批改一篇文章時常見的場景,先把一些容易發現的錯誤改掉,然後再仔細地讀一遍,又發現一些錯誤,需要循環幾次。」

詞語替換功能則是基於預訓練語言模型。預訓練語言模型是自然語言處理的新範式:使用大規模文本語料庫進行預訓練,對特定任務的小數據集微調,降低單個自然語言處理任務的難度。

2019 年,微軟提出了一種新的預訓練語言模型 UniLM。在「愛寫作」上,這個模型可以通過半遮蓋原單詞的策略,建議更符合表達者預期的替換詞語。

「對於詞語替換場景,直接用業界流行的 BERT 模型其實是不太合適的。」夏炎告訴 PingWest 品玩,「這個模型只考慮語法正確性,得出的結果不一定符合原詞的觀點和想法。」

以「The wine he sent to me as my birthday gift is too strong to drink」這句話為例子,替換目標詞是「strong」。

沒有遮蓋住目標詞(keep target word)的 BERT 模型,會給出詞義高度相關,但實際不太適合的替換詞:「stronger」、「strongly」、「hard」和「much」。

完全遮蓋住目標詞(mask target word)的 BERT 模型,輸出了「hot」、「thick」、「sweet」和「much」。這些詞在語法上都是對的,但跟目標詞的意思相比,差別還是比較大。

「我們的做法是,通過半遮蓋策略,把詞中一部分信息隱含掉,然後讓模型去預測,機器輸出了『tough』、『powerful』、『potent』和『hard』這些詞。」夏炎解釋道,「『powerful』這個詞,詞義跟原來單詞接近,又沒有簡單把『strong』變成其他形式,如『stronger』或『strongly』。」

得到替換詞列表後,「愛寫作」還會進行排序,最終把最適合的單詞呈現在最上面。

最後,「愛寫作」還有微軟自研的新一代 OCR 引擎,能檢測出圖像中的各類文字,同時支持列印體和手寫體的複雜文字場景識別。

「總而言之,『愛寫作』主要應用了自然語言理解技術。相較於語音識別和圖像處理等感知層面技術,自然語言理解是 AI 在認知層面要解決的最核心問題之一,讓機器理解人類語言是非常難的。」夏炎說,「在『愛寫作』中,我們用了很多自然語言處理領域內的經典任務,並且針對寫作這個場景優化模型。」

目前,「愛寫作」更多是根據用戶語法和用詞去做打分。夏炎告訴 PingWest 品玩,未來會研究一些新算法和模型,讓「愛寫作」不止能分析用戶的語法錯誤,還可以更深層地理解作文的結構和組織形式。「如果機器能理解用戶寫作意圖,就可以幫助他在內容組織上進行優化,這是 AI 輔助寫作的另一個場景」。

此外,據微軟亞洲研究院文章,語法糾正技術還可以被用在英文寫作之外的更多場景,比如電子郵件、PPT 演示文稿、翻譯文件等。

相關焦點

  • 孩子作業家長不會輔導怎麼辦 優學派學生平板來幫你
    「當了上學孩子的家長才知道,當年自己爸媽輔導功課有多難!」近日有家長一邊慨嘆「天道有輪迴」,一邊細數給孩子輔導作業的無奈。課後作業裡有的題目家長完全不會做,有的題目會做也給孩子講不明白,這時面對孩子求知的眼神,家長通常都很尷尬。到底有沒有辦法可以幫家長解決課後輔導這難題呢?當然有!
  • 用百度App搜作文,輔導孩子作業不發愁
    而每到下雪時節,學生黨們就多了一個新工作:寫作文。老師要求寫作文,學生們感到很為難,但是感到為難的還有廣大的家長朋友們。最近,小編在輔導家裡孩子寫作文的時候,也犯了老大難。於是小編求助於百度搜索,沒想到竟然發現了意外之喜。小編在百度App搜索框輸入「堆雪人作文」,首條就是相關作文的聚合卡片,在這裡可以按照年級、字數、體裁進行分類查找。
  • 訊飛英語通評測:5英寸黃金機身 超便攜專業AI英語輔導助教
    智能AI功能實現全英文專業輔導 助力學生英文學習天天向上如果學生碰到自己日常不會的單詞,直接對訊飛英語通說出中文或英文,機器運用科大訊飛人工智慧語音識別技術,能一鍵語音查詞,還可以拼讀查詞。每次英文考試,寫一篇好作文也是取得高分的關鍵,英語作文也是綜合考驗學生的語法能力,訊飛英語通內置智能寫作評測引擎,模擬真人老師批改維度。
  • 如何寫好小學語文作文?這份考試作文實戰攻略,能幫上孩子大忙!
    經常聽家長發愁說:孩子不太會寫作文,寫的作文也得不了高分。今天,老師就給大家分享一份精心整理的考試作文實戰攻略,具體告訴孩子寫人、敘事、描景、看圖類作文到底如何寫,幫助孩子拿作文高分!有需要的家長一定要記得收藏,能幫上孩子大忙!
  • 像老師一樣改英文作文,有道 AI 是怎麼做到的?
    孩子剛上小學,家長就為輔導英文作文而煩惱。冠詞副詞形容詞,小孩傻傻分不清。到了中學,語法和句式成了作文滿分的絆腳石,「現在完成時」和「過去進行時」雲裡霧裡。再到考雅思託福,講究文章結構和句式豐富程度,讓考生煩惱不堪。考試中的英語作文,佔分比例大,對綜合素質要求高,雖說不是所有人的痛,但也一定是很多學生要邁過去的一道坎。
  • 英文文獻怎麼找?檢索+翻譯,這個網站都幫你搞定了!
    眾所周知,大部分優秀的科研論文都發表在英文期刊上,而許多學者受外語能力限制,常常面對海量英文文獻發愁。檢索英文文獻難,更不要說翻譯文獻了。但是,如果告訴你,這些文獻都被轉化成了中文呢?首先,這是我們熟悉的Nature首頁。全英文環境,雖然首頁看起來並不難理解,但是一想到要面對一大堆英文版的搜索結果,並從中選出可用的,就覺得腦仁疼。
  • 輔導孩子不用愁,用這個APP輕鬆搞定「堆雪人、下雪了」等命題作文
    而每到下雪時節,學生黨們就多了一個新工作:寫作文。老師要求寫作文,學生們感到很為難,但是感到為難的還有廣大的家長朋友們。最近,小編在輔導家裡孩子寫作文的時候,也犯了老大難。於是小編求助於百度搜索,沒想到竟然發現了意外之喜。小編在百度App搜索框輸入「堆雪人作文」,首條就是相關作文的聚合卡片,在這裡可以按照年級、字數、體裁進行分類查找。
  • 為什麼英語輔導有時沒效果?英語學習的幾個層次,要循序漸進
    初中生、高中生有很多學習英語感覺很困難的,家長報了輔導班,請了輔導老師,有時候也沒啥成效,那這是為啥呢?其實,英語學習分幾個層次,要循序漸進,不要跳躍式教學。英語學習的幾個階段:①音標、詞組、句子記單詞;②詞組、句子記語法;③熟讀文章找語感;④多聽英文練聽力;⑤多說英文能交流;⑥英文熟練能作文。注意:英語考試裡的作文只是句子、詞組的堆砌,還不能稱為真正的英語作文,因為作文是最終階段,一般的學校、一般的學生是做不到的。第一個階段,音標、詞組、句子記單詞。
  • Tend.ai 可培訓機器人,幫你同時操作多個3D印表機和雷射切割機
    Tend.ai 可培訓機器人,幫你同時操作多個3D印表機和雷射切割機 作者:aiko 發布時間:
  • AI陪練口語 幫改作文!訊飛英語通評測:英語私教隨身帶
    頂部,Type-C接口被設置於此,此外還有個3.5mm耳機接口。此外,頂部和底部各有一個麥克風,起到降噪收聲的作用。背面,訊飛英語通擁有一個攝像頭和閃光燈,攝像頭主要用於智能寫作功能,負責拍攝作文圖像。閃光燈在補光的同時,日常也可以當作手電筒使用。左側,是電源鍵和音量鍵。
  • 如何把ai,ei,ui,輕鬆讀準,孩子兩分鐘搞定
    現在就讓我們,借著這股暖流,開始今天的課程吧。這節課,主要是跟大家一起學習,雙韻母ai(哀),ei(誒),ui(威)。那麼,到底什麼是雙韻母呢?雙韻母和單韻母,到底是什麼關係呢?如何才能把雙韻母輕鬆地讀準確呢?雙韻母,簡單理解,就是把兩個單韻母組合在一起,或者是把一個單韻母和一個聲母組合在一起,共同發一個音。這就是雙韻母。
  • 高考作文輔導價格環境優美_貴陽市花溪區創新教育培訓學校
    要想真正做到「為時而著」,就必須傾聽時代的足音,呼吸時代的空氣,把握時代的脈搏,讓自己的心合著時代的節奏一起跳動,真正用心去感悟時代、體驗時代,為時代而唱。時文,正是為時代而唱的。所以說,研讀時文本身就是一件時髦的事情。就高考而言,我們也必須談到高考作文與時文的關係問題,顯然這也是個時髦的話題。
  • 雅思考研四六級,打分評語糾錯啥都有,有道AI能幫改英語作文了
    看著對面主編犀利的目光,那一瞬間,真想問問自己為什麼不good good study, day day up。於是,我決定了,我要好好學習英語寫作!想要提升水平,不自己動筆寫總是差那麼點意思。那麼,問題來了:寫的好不好,誰來幫我批改呢?其實,打從小學開始學英語,小學、中學、四六級、雅思託福……英語作文怎麼提高從來都是一個難題。
  • 夸克搜索全新升級學習頻道 AI學習工具打造「作業百寶箱」
    當代父母輔導作業的親情翻車現場,在線智能學習工具或許是一劑解藥。近日,阿里旗下智能搜索APP夸克全新改版學習頻道,升級搜題、翻譯、作文、古詩詞等一系列AI學習工具,打造學生自學與家長輔導的「作業百寶箱」,並上線高考頻道助力考前衝刺。
  • 一搜就學會、一拍就有解 夸克AI工具打造學生與家長的智能學習助手
    利用暑假高效自學、智能輔導,AI學習工具幫你成為「別人家的孩子」。近日,阿里巴巴旗下智能搜索App夸克升級學習頻道,針對暑假學習場景的拍照搜題、作文搜索、錯題本、手寫筆記與生僻字識別、口算批改等,幫助學生精準解題、掌握知識點。「一搜就有、一拍就解、一看就會、不懂能問。」
  • 會不會寫英語作文,跟英語沒關係!7歲神童作家:這4個步驟是關鍵
    當你想提高孩子英語成績的時候,你到底想提高他的什麼?看似答案就在前半句,廢話,不都說了想提高孩子英語成績嘛。可是,"英語成績"四個字,還不如"聽說讀寫"來得有操作可能性。許多家長自己沒學過英語,或者學過但沒有學好英語,因此,在英語學習方法論上一片茫然,更是不具備能力鑑別可行和不可行的方法。
  • 家長如何輔導孩子寫作文?先聽孩子從小事學「說作文」
    在學前階段,孩子識字量有限,閱讀量不足,要用書面表達的方式來輸出信息難度很大,因而在這個階段,重點是在「說」這一項上,把「說」的能力培養好了,也就為將來的「寫」打下了基礎。能說好就能寫好。那麼,怎樣才能讓孩子「說好」呢?孩子不會講大話,因為他的生活中原本都是小事、小話(在大人眼裡),如果我們沒有耐心聽這些小事、小話,與孩子的交流就無從說起。
  • 高中輔導書排行榜:4本輔導書成「黑馬」
    經過我的細心「偵探」,終於把各科在高中輔導書排行榜上的「黑馬」給揪出來了。這可是我歷時一個月的成果,大家一定看哦。只要把文言文搞定了,再學一些做題技巧,語文可以悠哉悠哉拿高分。這本文先生《高中文言文逐句註解》,裡面的文章是一詞一句講的,字詞意思和句子語法都有,比老師講得還詳細,特適合文言文基礎弱的小夥伴。總共17篇文言文,光解析就講了314頁,閉著眼睛你也能想到有多詳細。
  • 學而思和猿輔導哪個好?對比作業幫直播課呢?
    今天,宇媽就給大家測評一下各家網校的英語課,分別是學而思網校和猿輔導以及作業幫直播課,一起來看看這三家名氣頗大的網課怎麼樣。  網站創始人宇媽深耕教育行業10多年,體驗過將近100家的英語培訓班的課程,訪談過多個教育專家,會根據家長需求和預算來推薦課程,會對每個機構的體驗課、師資、收費和效果等做個專業的評測,不會推薦大課時,還能拿到優惠價,感興趣的可以百度搜索下【宇媽測評】,對於選課這塊總能給你答案。
  • 看圖寫話作文怎麼寫?家長收藏起來,輔導孩子寫作很有用!
    小學一二年級的寫作題主要是看圖寫話,儘管看圖寫話的字數要求不多,通常是100-200字,但因為學生的理解能力不足,語言組織能力較差,經常不知道要寫什麼內容,這也令家長感到很苦惱。看圖寫話也有訓練方法,只要家長輔導得當,就再也不用擔心孩子不會做看圖寫話題了。