AI批改英語作文行不行?免費,覆蓋雅思考研四六級,打分評語糾錯都得有

2020-11-26 澎湃新聞

原創 關注前沿科技 量子位

煢煢 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

我,一個科技小編,最近在跟國外大佬的郵件交流中,感到飄過六級後的自己英語寫作水平那真是日漸捉急。

從句怎麼用?時態對不對?看著對面主編犀利的目光,那一瞬間,真想問問自己為什麼不good good study, day day up。

於是,我決定了,我要好好學習英語寫作!

想要提升水平,不自己動筆寫總是差那麼點意思。

那麼,問題來了:寫的好不好,誰來幫我批改呢?

其實,打從小學開始學英語,小學、中學、四六級、雅思託福……英語作文怎麼提高從來都是一個難題。

尤其是各類考試,有嚴格的評分標準,可身邊哪能時時有經驗豐富的閱卷老師幫忙有針對性地修改提高呢?

聽聞我的煩惱,一位網易有道的胖友向我招了招手:你看我手機裡這個紅色的App,裡面最新上線了一隻AI,能幫你批改英文小作文喲。

對啊,如果AI真的能準確評分,甚至給出修改意見,那像我一樣的同學們不就能隨時隨地把英語作文練到飛起了嗎?

略一調研,我發現,現在有AI批改英語作文功能的產品還真不少:網易有道詞典、微軟愛寫作(小英)、批改網、Grammarly……

想到現在宅在家裡的大朋友、小朋友可能也有同樣的困擾,我決定親自測試一下這些AI們到底靠譜不靠譜。

AI批作文,到底哪家強?

初篩一番,我挑選出了幾個免費、容易上手使用的選手參與測評,分別是:網易有道詞典AI作文批改,微軟愛寫作,以及Grammarly免費版。

那麼,話不多說,讓我們直接進入比賽。

Round 1:手寫識別

像小學中學英語考試、四六級以及考研英語、雅思託福考試,實際應試時都需要在紙面上進行寫作,因此在練習時,同學們也往往會選擇手寫。

寫完一遍,再打一遍字,未免有些麻煩,如果拍張照,AI就能自己識別我到底寫了什麼,那就方便多了。

有道AI作文批改和微軟愛寫作均支持圖片識別功能。而Grammarly……由於沒有這一功能,這位選手選擇暫時退場。

我使出洪荒之力,用非標準應試字體謄寫了一篇作文,測試兩位選手。

先來看有道AI作文批改的表現:

識別得相當準確,有塗改的地方也沒有出現誤識別的情況,為數不多的幾個需要手動修改的地方,基本上都是手寫時字母和字母之間空格太大,因此識別時成了兩個單詞。

再來看一下微軟小英的結果:

由於我沒寫標題,小英強制把第一段都識別成了標題。忽略掉這一點的話,識別準確率也很高。但對於標點符號的識別不及有道AI作文批改敏感(上圖紅色標註處)。

還有個小問題:如果你把兩個詞寫得比較開,小英會識別出多餘的空格,檢查得不仔細的話,會影響下一步評分的準確性。

另外,相比於只有網頁版的微軟愛寫作,手機端的有道詞典可以直接拍照識別,無需再倒一手把照片傳到電腦上,還是要方便一些。

Round 2:糾錯能力

如果說OCR只是影響用戶使用方便與否的細節,那AI批改作文的重點,當然在於能不能準確抓住作文中的bug。

有道AI作文批改、微軟小英和Grammarly都有識別文中語法錯誤並給出修改意見的功能。

這一輪,我們用一些單句來測試一下誰的Debug能力更強。

例句一:When the girl will leave, she fount an old begger in the tree and looked at angry and cold.

有時態錯誤,也有拼寫錯誤。

有道揪出了4處錯誤:

具體的判斷是:①疑似用詞不當,建議將「will leave」修正為「left」;②疑似動詞時態錯誤,建議將「fount」修正為「found」;③疑似名詞誤用,建議將「begger」修正為「beggar」;④疑似介詞「at」冗餘,建議刪除。

把問題拋給微軟小英,它也同樣找出了這4處錯誤,並給出了一個單詞替換建議。

具體判斷是:①錯誤動詞時態,將「will leave」改為「left」;②動詞用法錯誤,將「fount」改為「found」;③單詞拼寫錯誤,將「begger」改為「beggar」;④冗餘,刪除「at」;⑤建議將「cold」換成「bitter」、「hard」、「mean」。

最後看一下Grammarly的判斷。

Grammarly免費版指出了一處單詞拼寫錯誤,並建議我升級付費版。

同樣,在「But this stress didn’t stop me from thinking to attend the biggist activity in our school」這個句子中,有道和小英都指出了3處錯誤:

介詞「to」改「about」;動詞「attend」改「attending」;「biggist」拼寫錯誤,改為「biggest」。

而Grammarly免費版還是僅僅指出了「biggist」這個拼寫錯誤。

看來,就免費體驗來說,Grammarly的語法修改偏於簡單了。

最後,給有道AI作文批改和微軟小英出一個加試題。

例句二:On a cold morning, while I was watching a girl buy bread and milk in the fiont for me.

對於AI而言,這個句子的識別難點在於,同一個對象涉及了多個錯誤,「fiont」這個拼寫錯誤後面,緊跟著「for」這個介詞使用錯誤。

面對這一題,有道成功把「in the front of」這個整體識別了出來,既指出了拼寫錯誤,也發現詞組中介詞的錯誤。

而微軟小英的改法令人有些看不懂,難道是感應到了句子裡主人公的內心戲?

這輪比拼結束,小小總結一下。

同樣是免費,Grammarly免費版相比於兩位中文世界的選手,差距有點大。

不過,Grammarly有插件版本,直接寫郵件的時候,能夠邊寫邊糾錯。

但如果是想要在AI的幫助下提升英語寫作能力,Grammarly免費版恐怕不是上佳選擇。

而有道AI作文批改和微軟小英,都更符合國內的英語學習路徑,總體表現都還不錯。不過,在錯誤複雜度提高的時候,有道的表現略勝一籌。

Round 3:評分準確度

另一個重點,是評分的準確度。

畢竟,考試都有嚴格的評分標準,能否依據標準給出準確的打分,對於廣大有應試需求的同學們而言還是非常重要的參考指標。

有道AI作文批改和微軟愛寫作,都支持多學段英語作文批改,涵蓋小學、初中、高中、四六級、雅思託福和考研英語。

至於Grammarly,作為一款「舶來」應用,並不是很適合我考試大國的風格,無法區分學段和考試類型。

不過,使用Grammarly,也可以針對自己的情況進行一些個性化設置,包括Audience(受眾)、Formality(正式程度)、Domain(領域)。

問題還是,免費版選擇有限。

我在網上找了一篇 7.5 分的雅思範文,人類老師對這篇作文的評價是:詞彙豐富、語法點豐富,並且論證全面。

那麼AI會如何評價這篇作文呢?

還是先來看看有道AI作文批改的答卷。

有道給這篇作文打了8分,並且就詞彙、結構、語法和內容都給出了評級。

點擊查看點評,還能看到AI閱卷官從詞、句、篇章著手,對作文的總體評價,一些更高級詞彙的推薦,以及好詞的鞏固。

……詞彙量較為豐富……文章較為流暢……詞彙基礎紮實。

這樣的評語,與人類老師的判斷基本一致。

同樣一篇文章,我們來看看微軟小英怎麼說。

同樣給出了8分,比較特別的是,小英會統計作文中所使用的考綱詞彙、邏輯連詞和從句數量。

與有道給出的總體評價報告不同,小英給出的是文章結構、句間關係、切題程度、展開程度4個評價指標。

需要注意的是,如果想參考文章內容中切題程度這個指標,必須填寫文章標題。而展開程度這個指標,我反覆試了多篇作文,從高考範文到雅思範文,都是穩定一星……

這輪比拼結束,同樣做個小結。

總體而言,有道和小英的評分結果都根據考試類型的不同,與考試評分標準對齊,具有參考價值。

在細節上,有道會根據字數、詞彙使用情況、語句邏輯及銜接等方面給出綜合評價,微軟小英則是分點給出建議,主要集中在文章結構和句間關係兩個方面。

不過,在測試中微軟小英出現了一些小bug。

比如六級作文的滿分是15分,但在得分界面其最高分卻是25分。

背後技術

看來有道詞典批改作文的AI,確實有兩把刷子。

出於科技小編的好奇心,我向文章開頭給我推薦軟體的胖友打聽了一下,在這背後究竟是怎樣的技術。

以有道為例,其英語作文批改分為三個核心模塊:評分模塊 + 評語模塊 + 糾錯模塊。

評分模塊負責提供總分,及詞彙、語法、結構得分,採用的是傳統方法 + 深度學習方法。

評語模塊提供全文評語、詞彙推薦、範文推薦。

糾錯模塊提供14個類別的語法錯誤識別及修正,包括淺層的拼寫錯誤、深層的語法錯誤等。

其中,拼寫糾錯運用的是基於BERT的NER實體識別技術。

語法糾錯,則被定義為序列到序列的生成問題。核心基於Transformer架構。

核心模型所做的事,其實類似於翻譯:將語法錯誤的句子翻譯成語法正確的句子。

此外,在語法糾錯中,還採用了遷移學習和對抗學習。用真實語料和基於真實用戶錯誤分布生成的海量偽語料,不斷提升模型能力。

以上是網易有道詞典的質量評估結果。P值為精確率(Precision),R值為召回率(Recall),F0.5為P值與R值的調和平均,其值越高,通常表示算法性能越好。

可以看到,有道AI作文批改的測試結果已達行業領先水平。

好啦,看罷這一篇試用報告,不知道正備考四六級、雅思託福、考研英語的你願意pick AI為你免費批改作文嗎?

今天先醬,有其他煩惱需要評測AI工具,也可以留言區跟我說哦~

作者系網易新聞·網易號「各有態度」籤約作者

— 完 —

<英偉達NLP公開課> 開始報名啦,4月9號晚8點,英偉達GPU計算專家將分享 FasterTransformer 2.0 的原理與應用,分享如何針對 decoder 和 decoding 進行優化。

戳二維碼,備註「英偉達」即可報名、加交流群,主講老師也會進群與大家交流互動哦~

直播報名 | Decoder與Decoding的優化與加速

天文航天親子社群招募,一起來玩吧~

2020年是個天文大年,4月8日有全年最大的超級月亮,6月有橫跨中國的日環食,8月有英仙座流星雨,10月還有兩年一次的火星衝日,12月有雙子座流星雨。

我們邀請「美國國家地理極致中國探享家劉允」和天文愛好者們,組建了一個天文航天親子社群,群裡除了交流天文航天知識,還會組織一系列講座、線下觀星、航天探訪活動。

如果你有寶寶,也熱愛天文航天,一起來玩啊。

量子位 QbitAI · 頭條號籤約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

喜歡就點「在看」吧 !

文章已於修改

原標題:《AI批改英語作文行不行?免費,覆蓋雅思考研四六級,打分評語糾錯都得有 | 測評》

閱讀原文

相關焦點

  • 考研英語四六級作文熱點預測,垃圾分類作文如何寫?
    12月是本年來最後一個考試月,在本月主要的考試就是考研和大學英語四六級的考試,對於很多考研的同學來說,尤其是英語是一個比較頭痛的問題,而其中的作文是最讓人頭痛的問題。英語作文怎麼寫才好?怎麼才能得到高分?這年的英語作文會考什麼?
  • 英語四六級誕生30年:「中年危機」提前來了
    隨著英語測試種類的越來越多,不少大學生對於四六級考試「中國式」的考題表示不認可,同時,不少用人單位對於四六級考試分數隻做一個基本要求,需要較高英語水平的崗位都要求學生有雅思、託福成績。一時間,人們對於四六級考試能否客觀檢測出學生英語水平的質疑聲越來越大。  王洋去年於北京市某985高校畢業後就職於一家北京的事業單位。
  • 英語作文總扣分?三招教你搞定中高考,四六級,考研
    劉老師從任教英文八年的時間來看,對英文考試中的寫作版塊是情有獨鍾,我始終覺得,學生能在考試中把英語作文寫好了,其他的題根本就不是問題…用好這三招,你也可以得高分:01語法錯誤請歸零,不要輕易挑戰長難句英語和漢語最大的不同是英文是非常講究語法文法的
  • 英語四六級作文題目與考研命題方向有關?看何凱文老師怎麼說!
    四六級考試於上周結束啦,對於英語四六級作文大家都對答案了嗎?今天文都網校小編為大家整理了四六級考試作文範文,並通過四六級作文中分析找到與考研的關係,命題方向,希望能幫助正在備戰2020考研的小夥伴們,一起來了解下吧~2019年下半年四級考試作文範文:第一套:以信件的形式推薦學習漢語的大學第二套:向外國友人推薦一個學漢語的地方
  • 考研進入倒計時,英語六級和考研英語如何兼顧?答:抓主要矛盾!
    距離2021年考研還剩下不到一個月的時間,12月份中除了研究生入學考試之外還有一個重要的考試,那就是大學英語四六級,而且大學英語四六級考試是在12月12號,時間上比考研還要早。考研要考英語,大學英語四六級又和考研英語非常類似,對於還沒有通過大學英語四六級的同學,這個時候就面臨一個選擇的問題:是抽出時間準備英語四六級,還是繼續準備考研英語?或者說兩個考試同時準備?首先可以確定的是通過大學英語四六級是非常重要的,不管是找工作還是考研,甚至保研,通過英語六級都是一個明顯的加分項。
  • 2016考研英語小作文:技巧為先 文採其次
    初試提分寶典答題技巧:考研政治  考研英語 作文模板 考研數學  考研專業課2016全國考研勵志群:367370343      根據《考研英語大綱》規定,考研英語作文就有兩類了,一個大作文,另一個是新增的小作文(10分)。
  • 廈門思明英語四六級培訓機構哪家比較好
    廈門思明英語四六級培訓機構哪家比較好?新航道英語四六級考試培訓致力於打造明星教師與精品課程,突破傳統教學方法,以分項教學為基礎,在多年的應試教學中,積累了優秀的師資團隊和豐富的教學經驗。
  • 79分前輩的兩次總結:考研英語複習要怎樣厚積薄發
    但是這四多也是有講究的,科學的積累會讓你在考研前期所有的努力擰成一股勁,為後面的質變積攢力量。   ►個人情況   18年二戰考研,成功考上廈大。兩次的英語一都是79分。說實話,這個分數一般般,但是就個人來說還是很滿意的。
  • 英語四六級作文如何備考?怎樣才能得高分?
    距離四六級考試只剩下不到20天的時間,考試日期在一天天逼近,最近有不少同學在後臺提問作文怎麼樣才能得高分,小編很負責任的告訴大家,英語四六級作文現在開始還不晚!想要從現在開始準備,實現自己的作文高分夢,你需要一本適合你的真題書——巨微英語《四級真題逐句精解》解析是一句一句細講的,重點單詞和語法都有標註,哪句不會看哪句,夯實基礎大幅提分必備,很多英語渣都是用它過的級。
  • 英語基礎極差,怎麼努力才能通過考研英語國家線?
    (啟航姐姐終於扯到了重點……)來吧,今天熱騰騰的乾貨奉上~我之前的英語四級考試考了340分,英語基礎極差,也就剩下了寥寥無幾的詞彙量,對於語法是基本都不會,所以完型閱讀翻譯寫作對於我都是很大的問題!跪求怎麼通過這不到半年的時間提高英語成績通過考研英語國家線?不要暗示自己英語不好,英語屬於比較簡單的語言。
  • 四六級準考證號忘了怎麼辦?2018年12月四六級查分時間
    通常教務處網站會有查詢頁面,甚至很多學校考慮到同學們的英語四、六級準考證忘了,會直接提供身份證信息查詢四六級成績的方法。方法3:等成績單法  如果以上方法都不能幫助你找到你的準考證號,那就只能慢慢等學校下放成績單啦...二、英語四級多少分算過?
  • 英語六級作文滿分範文:免費下載歌曲
    新東方網>大學教育>四六級>複習輔導>六級>六級輔導>作文>正文英語六級作文滿分範文:免費下載歌曲 2019-04-17 23:50 來源:新東方網整理
  • 大學英語四六級有多重要?不考過這些企業無機會進入,很影響就業
    對於大學的校園,學生是既好奇又充滿期待,但是當你整理好行囊進入大學以後,學長們就會告訴你很多事情,比如大學可以參加學生會,可以報社團,可以考研,必須考過大學英語四六級等等。
  • 關於英語四六級備考複習,給大家的幾點小建議,下次一定考過
    關於英語四六級備考複習,給大家的幾點小建議,下次一定考過,今天我想說說大家四六級成績的事,總結一下妙招。英語四六級考試複習的一些建議:第一點:增加自己的單詞量,記住英語單詞是最愚蠢的方法,但是對於初學者來說是必要的,因為很難提高,所以請直接向基礎差的學生取英語長的句子,大家可以從日常的學習和問題中積累重要的英語單詞,英語四六級對單詞量的要求也很高,請打好基礎。第二個要點:多聽英語短文吧,為什麼是短文,不是長文呢?
  • 考研:英語作文「萬能」的最後一段,不用自己寫一個字
    考研:英語作文「萬能」的最後一段,不用自己寫一個字明日就要考研了,勵志學生也真的是為每一位考研兒擔心與著急,明天下午考的是英語,無論是英語一,還是英語二,作文都是佔了很大的分數,同時也是很好拿分的一個題目,有很多同學給小編留言,想要英語作文最後一段。這一段不用自己寫一個字,只需要自己背過與會默寫即可。
  • 大學英語「四六級」沒通過,可能影響到就業,國企外企基本無緣
    大學中有很多考試,期末考試,專業證書的考試,還有比較重要的英語四六級考試,雖然大部分的院校四六級不會影響到畢業,但是其實這是一場非常重要的考試,會有很多的影響。大學英語四六級到底有多重要?1.影響到考研現在想要考研的同學越來越多,研究生考試筆試中是要英語的,而英語的難易程度也不是很簡單,但是一般能考過六級的同學對於考研的英語把握還是很大的,雖然考研不會要求考過四六級,但是在複試時導師會有要求的。2.
  • B2C在線教育競品分析 | 考蟲、有道精品課、朗播四六級
    其業務包括四六級、考研、公考、出國留學等在線課程。其中,四六級課程培訓是其明星產品,199元的低廉價格幫其迅速佔領市場。據統計,考蟲在多個課程的市場佔有率超過 50%,考蟲目前的中國大學生付費用戶數位列行業第一。其創始人表示,考蟲會繼續加大在教學教研上的投入,藉助科技手段建立更高的產品壁壘。
  • 2014年6月大學英語四六級裸考救星:用主觀題搶分
    四六級考試一共有四個部分:寫作、聽力、閱讀和翻譯。寫作和翻譯是我們要動手寫的主觀題,聽力和閱讀是選答案的客觀題,在還有一周上考場的時候,反而主觀題準備起來更有效。  1.主觀題:寫作和翻譯  寫作,毫無疑問,要靠模版拯救即將戰鬥在四六級考場上的小夥伴們。
  • 英語四六級裸考是什麼感覺?查成績的時候才會明白!
    六月份即將要來了,大學英語四六級開始也不遠了。我們都知道英語四六級一年有兩次考試,上半年英語四六級考試時間已經公布,是6月16日。距離四六級英語考試只剩下20天不到的時間,有朋友會問現在複習還來得及嗎?個人覺得還是來得及的,畢竟一門語言掌握程度是靠基礎的,有基礎了感覺合格應該問題不大。
  • 考研國家線官宣!這些考研常識你必須知道
    6.考研英語與四六級的關係 毋庸置疑,考研英語與大學英語四六級肯定是有很大差別的。但是同為英語考試,四六級和考研英語必然有些地方是相通的,一起複習能夠一起進步。