AI批改英語作文行不行?免費,覆蓋雅思考研四六級,打分評語糾錯都得有

2020-12-05 澎湃新聞

原創 關注前沿科技 量子位

煢煢 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

我,一個科技小編,最近在跟國外大佬的郵件交流中,感到飄過六級後的自己英語寫作水平那真是日漸捉急。

從句怎麼用?時態對不對?看著對面主編犀利的目光,那一瞬間,真想問問自己為什麼不good good study, day day up。

於是,我決定了,我要好好學習英語寫作!

想要提升水平,不自己動筆寫總是差那麼點意思。

那麼,問題來了:寫的好不好,誰來幫我批改呢?

其實,打從小學開始學英語,小學、中學、四六級、雅思託福……英語作文怎麼提高從來都是一個難題。

尤其是各類考試,有嚴格的評分標準,可身邊哪能時時有經驗豐富的閱卷老師幫忙有針對性地修改提高呢?

聽聞我的煩惱,一位網易有道的胖友向我招了招手:你看我手機裡這個紅色的App,裡面最新上線了一隻AI,能幫你批改英文小作文喲。

對啊,如果AI真的能準確評分,甚至給出修改意見,那像我一樣的同學們不就能隨時隨地把英語作文練到飛起了嗎?

略一調研,我發現,現在有AI批改英語作文功能的產品還真不少:網易有道詞典、微軟愛寫作(小英)、批改網、Grammarly……

想到現在宅在家裡的大朋友、小朋友可能也有同樣的困擾,我決定親自測試一下這些AI們到底靠譜不靠譜。

AI批作文,到底哪家強?

初篩一番,我挑選出了幾個免費、容易上手使用的選手參與測評,分別是:網易有道詞典AI作文批改,微軟愛寫作,以及Grammarly免費版。

那麼,話不多說,讓我們直接進入比賽。

Round 1:手寫識別

像小學中學英語考試、四六級以及考研英語、雅思託福考試,實際應試時都需要在紙面上進行寫作,因此在練習時,同學們也往往會選擇手寫。

寫完一遍,再打一遍字,未免有些麻煩,如果拍張照,AI就能自己識別我到底寫了什麼,那就方便多了。

有道AI作文批改和微軟愛寫作均支持圖片識別功能。而Grammarly……由於沒有這一功能,這位選手選擇暫時退場。

我使出洪荒之力,用非標準應試字體謄寫了一篇作文,測試兩位選手。

先來看有道AI作文批改的表現:

識別得相當準確,有塗改的地方也沒有出現誤識別的情況,為數不多的幾個需要手動修改的地方,基本上都是手寫時字母和字母之間空格太大,因此識別時成了兩個單詞。

再來看一下微軟小英的結果:

由於我沒寫標題,小英強制把第一段都識別成了標題。忽略掉這一點的話,識別準確率也很高。但對於標點符號的識別不及有道AI作文批改敏感(上圖紅色標註處)。

還有個小問題:如果你把兩個詞寫得比較開,小英會識別出多餘的空格,檢查得不仔細的話,會影響下一步評分的準確性。

另外,相比於只有網頁版的微軟愛寫作,手機端的有道詞典可以直接拍照識別,無需再倒一手把照片傳到電腦上,還是要方便一些。

Round 2:糾錯能力

如果說OCR只是影響用戶使用方便與否的細節,那AI批改作文的重點,當然在於能不能準確抓住作文中的bug。

有道AI作文批改、微軟小英和Grammarly都有識別文中語法錯誤並給出修改意見的功能。

這一輪,我們用一些單句來測試一下誰的Debug能力更強。

例句一:When the girl will leave, she fount an old begger in the tree and looked at angry and cold.

有時態錯誤,也有拼寫錯誤。

有道揪出了4處錯誤:

具體的判斷是:①疑似用詞不當,建議將「will leave」修正為「left」;②疑似動詞時態錯誤,建議將「fount」修正為「found」;③疑似名詞誤用,建議將「begger」修正為「beggar」;④疑似介詞「at」冗餘,建議刪除。

把問題拋給微軟小英,它也同樣找出了這4處錯誤,並給出了一個單詞替換建議。

具體判斷是:①錯誤動詞時態,將「will leave」改為「left」;②動詞用法錯誤,將「fount」改為「found」;③單詞拼寫錯誤,將「begger」改為「beggar」;④冗餘,刪除「at」;⑤建議將「cold」換成「bitter」、「hard」、「mean」。

最後看一下Grammarly的判斷。

Grammarly免費版指出了一處單詞拼寫錯誤,並建議我升級付費版。

同樣,在「But this stress didn’t stop me from thinking to attend the biggist activity in our school」這個句子中,有道和小英都指出了3處錯誤:

介詞「to」改「about」;動詞「attend」改「attending」;「biggist」拼寫錯誤,改為「biggest」。

而Grammarly免費版還是僅僅指出了「biggist」這個拼寫錯誤。

看來,就免費體驗來說,Grammarly的語法修改偏於簡單了。

最後,給有道AI作文批改和微軟小英出一個加試題。

例句二:On a cold morning, while I was watching a girl buy bread and milk in the fiont for me.

對於AI而言,這個句子的識別難點在於,同一個對象涉及了多個錯誤,「fiont」這個拼寫錯誤後面,緊跟著「for」這個介詞使用錯誤。

面對這一題,有道成功把「in the front of」這個整體識別了出來,既指出了拼寫錯誤,也發現詞組中介詞的錯誤。

而微軟小英的改法令人有些看不懂,難道是感應到了句子裡主人公的內心戲?

這輪比拼結束,小小總結一下。

同樣是免費,Grammarly免費版相比於兩位中文世界的選手,差距有點大。

不過,Grammarly有插件版本,直接寫郵件的時候,能夠邊寫邊糾錯。

但如果是想要在AI的幫助下提升英語寫作能力,Grammarly免費版恐怕不是上佳選擇。

而有道AI作文批改和微軟小英,都更符合國內的英語學習路徑,總體表現都還不錯。不過,在錯誤複雜度提高的時候,有道的表現略勝一籌。

Round 3:評分準確度

另一個重點,是評分的準確度。

畢竟,考試都有嚴格的評分標準,能否依據標準給出準確的打分,對於廣大有應試需求的同學們而言還是非常重要的參考指標。

有道AI作文批改和微軟愛寫作,都支持多學段英語作文批改,涵蓋小學、初中、高中、四六級、雅思託福和考研英語。

至於Grammarly,作為一款「舶來」應用,並不是很適合我考試大國的風格,無法區分學段和考試類型。

不過,使用Grammarly,也可以針對自己的情況進行一些個性化設置,包括Audience(受眾)、Formality(正式程度)、Domain(領域)。

問題還是,免費版選擇有限。

我在網上找了一篇 7.5 分的雅思範文,人類老師對這篇作文的評價是:詞彙豐富、語法點豐富,並且論證全面。

那麼AI會如何評價這篇作文呢?

還是先來看看有道AI作文批改的答卷。

有道給這篇作文打了8分,並且就詞彙、結構、語法和內容都給出了評級。

點擊查看點評,還能看到AI閱卷官從詞、句、篇章著手,對作文的總體評價,一些更高級詞彙的推薦,以及好詞的鞏固。

……詞彙量較為豐富……文章較為流暢……詞彙基礎紮實。

這樣的評語,與人類老師的判斷基本一致。

同樣一篇文章,我們來看看微軟小英怎麼說。

同樣給出了8分,比較特別的是,小英會統計作文中所使用的考綱詞彙、邏輯連詞和從句數量。

與有道給出的總體評價報告不同,小英給出的是文章結構、句間關係、切題程度、展開程度4個評價指標。

需要注意的是,如果想參考文章內容中切題程度這個指標,必須填寫文章標題。而展開程度這個指標,我反覆試了多篇作文,從高考範文到雅思範文,都是穩定一星……

這輪比拼結束,同樣做個小結。

總體而言,有道和小英的評分結果都根據考試類型的不同,與考試評分標準對齊,具有參考價值。

在細節上,有道會根據字數、詞彙使用情況、語句邏輯及銜接等方面給出綜合評價,微軟小英則是分點給出建議,主要集中在文章結構和句間關係兩個方面。

不過,在測試中微軟小英出現了一些小bug。

比如六級作文的滿分是15分,但在得分界面其最高分卻是25分。

背後技術

看來有道詞典批改作文的AI,確實有兩把刷子。

出於科技小編的好奇心,我向文章開頭給我推薦軟體的胖友打聽了一下,在這背後究竟是怎樣的技術。

以有道為例,其英語作文批改分為三個核心模塊:評分模塊 + 評語模塊 + 糾錯模塊。

評分模塊負責提供總分,及詞彙、語法、結構得分,採用的是傳統方法 + 深度學習方法。

評語模塊提供全文評語、詞彙推薦、範文推薦。

糾錯模塊提供14個類別的語法錯誤識別及修正,包括淺層的拼寫錯誤、深層的語法錯誤等。

其中,拼寫糾錯運用的是基於BERT的NER實體識別技術。

語法糾錯,則被定義為序列到序列的生成問題。核心基於Transformer架構。

核心模型所做的事,其實類似於翻譯:將語法錯誤的句子翻譯成語法正確的句子。

此外,在語法糾錯中,還採用了遷移學習和對抗學習。用真實語料和基於真實用戶錯誤分布生成的海量偽語料,不斷提升模型能力。

以上是網易有道詞典的質量評估結果。P值為精確率(Precision),R值為召回率(Recall),F0.5為P值與R值的調和平均,其值越高,通常表示算法性能越好。

可以看到,有道AI作文批改的測試結果已達行業領先水平。

好啦,看罷這一篇試用報告,不知道正備考四六級、雅思託福、考研英語的你願意pick AI為你免費批改作文嗎?

今天先醬,有其他煩惱需要評測AI工具,也可以留言區跟我說哦~

作者系網易新聞·網易號「各有態度」籤約作者

— 完 —

<英偉達NLP公開課> 開始報名啦,4月9號晚8點,英偉達GPU計算專家將分享 FasterTransformer 2.0 的原理與應用,分享如何針對 decoder 和 decoding 進行優化。

戳二維碼,備註「英偉達」即可報名、加交流群,主講老師也會進群與大家交流互動哦~

直播報名 | Decoder與Decoding的優化與加速

天文航天親子社群招募,一起來玩吧~

2020年是個天文大年,4月8日有全年最大的超級月亮,6月有橫跨中國的日環食,8月有英仙座流星雨,10月還有兩年一次的火星衝日,12月有雙子座流星雨。

我們邀請「美國國家地理極致中國探享家劉允」和天文愛好者們,組建了一個天文航天親子社群,群裡除了交流天文航天知識,還會組織一系列講座、線下觀星、航天探訪活動。

如果你有寶寶,也熱愛天文航天,一起來玩啊。

量子位 QbitAI · 頭條號籤約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

喜歡就點「在看」吧 !

文章已於修改

原標題:《AI批改英語作文行不行?免費,覆蓋雅思考研四六級,打分評語糾錯都得有 | 測評》

閱讀原文

相關焦點

  • 雅思考研四六級,打分評語糾錯啥都有,有道AI能幫改英語作文了
    於是,我決定了,我要好好學習英語寫作!想要提升水平,不自己動筆寫總是差那麼點意思。那麼,問題來了:寫的好不好,誰來幫我批改呢?其實,打從小學開始學英語,小學、中學、四六級、雅思託福……英語作文怎麼提高從來都是一個難題。
  • 網易有道詞典上線AI作文批改功能,可自動批改雅思、四六級英語作文
    藍鯨教育4月8日訊,近日,網易有道詞典推出新功能「AI作文批改」,通過人工智慧技術自動批改英語作文,幫助各個學段學習者檢測作文水平,提升英語寫作能力。使用者可直接拍照或手動輸入需批改的作文,以拍照批改為例,可選擇照片庫中提前拍好的作文圖片,或直接對手寫作文進行拍照。系統會錄入和識別具體內容,識別後也支持手動修改調整後再做批改。有道詞典AI作文批改會從詞、句、篇章多個維度,對英語作文進行打分和批改,並生成報告便於後續學習提高。
  • 假如讓AI來批改英語作文……
    但對於寫作的環節,我們卻很少有機會得到訓練。書面交流不僅更要比口語更遵守語法規則,還對一個人的詞句篇章、構思邏輯等有更高的要求。同時,寫作環節的反饋,會耗費更多的精力和時間。為了解決英語學習者在寫作上的難點和痛點,近期,網易有道詞典上線了以人工智慧驅動的批改英文作文的功能——AI作文批改。
  • 讓英語作文更精彩的智能批改工具
    點擊左上角關注我們 在英語學習中,寫作是對詞彙、語法、閱讀、表達的全方位考察,可以很好地反映學習者的語言綜合素養。然而,如何實現對英語作文快速準確地評判並給予反饋,成為學生、老師、家長們共同面臨的難題。現在,小編為你介紹一種新方法:讓 AI 來批改你的作文。
  • 有道詞典推出全新AI技術 一鍵自動批改英語作文
    據悉,有道詞典AI作文批改針對不同的英語寫作學習要求劃分了小學、初中、高中、大學四六級、雅思、託福等涵蓋K12、大學、成人等全學段人群,不同學段的分數設定和評判要求與考試標準一致。隨後,用戶可以直接拍照或者手動輸入需要批改的作文。
  • 繼神經網絡翻譯後 網易有道詞典再推AI作文批改新功能
    網易有道詞典AI作文批改高考作文,一鍵拍照識別手寫作文點擊「確認提交「後,有道詞典AI作文批改會從詞、句、篇章多個維度對英語作文進行打分和批改,並生成個性化報告便於後續學習提高,可以說比真實的英語作文批改老師更貼身、更細緻。
  • 用機器批改英語作文?「句酷批改網」做的就是這樣的事
    而從去年到今年,似乎教育領域也在接受這一趨勢,原本重度依賴人工的作文批改,現在網際網路人也想將它們自動化——比如申論作文的批改,比如英語作文批改。  句酷批改網就是提供英語作文批改服務的公司。他們的服務面向大學老師以及學生(去年拓展到高中生),通過訓練打分引擎,使之可以自動按照四六級考試、高考以及中考的作文評分標準,來自動批改學生的作文、給出評分,並在有語法、用詞、表達不規範的地方給予反饋提示,給學生修改的建議。
  • 網易有道推AI作文批改功能 可自動批改英語作文
    近日,有消息稱,網易有道詞典推出了AI作文批改新功能,其可自動批改英語作文。據了解,網易有道詞典的AI作文批改功能主要是由評分模塊、評語模塊和糾錯模塊三個模塊構成。這三個模塊構成了AI作文批改的檢測、批改、生成報告等多個功能。在網易有道詞典APP中,使用者可以拍照或手動輸入需要批改的作文。
  • Transformer自動糾語法、改論文,我們試了這個免費英文寫作新神器
    在當前疫情下,我們已經離不開居家學習了,各種備考也得提到日程上。機器之心的讀者大多數都是理科生,數學、計算機都還是有一些「天賦」。然而對於英語,貌似這些天賦幫不到我們什麼,缺乏「語感」的我們在寫作文時經常會犯一些拼寫、語法錯誤。英語閱讀或聽力等其它部分還好,有比較標準的對錯判斷標準。
  • 考研英語和四六級英語有什麼不同?
    這樣來看,似乎四六級要求的分數比較高,但是考研英語和四六級英語哪個更難?或許所有人都會說:那肯定是考研英語啊。考研英語和四六級英語到底有什麼不同?為什麼考研英語要求分數低,卻成為上岸路上最大的攔路虎?1.
  • 英語四六級沒過,對考研到底有什麼影響呢
    英語四六級沒過,對考研到底有什麼影響呢?2020年考研初試已經告一段落,很多同學都已經投入了考研複試複習的狀態之中,但是有很多的小夥伴從開始準備考研的時候可能就在擔憂,英語四六級沒過,對考研到底有沒有影響?
  • 從翻譯工具到跨語言表達助手,搜狗翻譯持續探索AI教育新格局
    同時,使用經典的BACKTRANS 和 DIRECTNOISE算法產生海量數據並將其混合生成超千萬句的糾錯訓練集,配合數萬句高質量的人工改錯數據,訓練出了適合中國英文寫作用戶的糾錯模型。據統計,搜狗AI寫作助手的糾錯準確率高達96.83%,遠超行業平均水平。
  • 英語學習機怎麼選?有道詞典和訊飛智能學習機哪一個更適合孩子
    其實很多家長都不知道的是,除了市面上比較流行的有道這類外語App,訊飛智能學習機裡的英語輔導功能也十分好用呢!最近網易有道詞典新上線了AI作文批改功能,它會從考試規定的詞數、詞彙豐富度、拼寫、語法、句式,以及篇章的邏輯性、甚至主題相關性等多個維度進行打分。最終會給出總分,以及詞彙、語法和結構等得分,並提供評語、詞彙及範文推薦。
  • 2021考研英語(四六級)作文預測-後悔遺憾(計劃與體驗)
    2021考研英語(四六級)作文預測-後悔遺憾(計劃與體驗)分析:後悔是人之常情,在英語作文中,此類話題可以激發很多有用的表達,比如個人感受及個人情感等。我們要從中進行抽象提取,就是人生的計劃或夢想,或挫折或體驗,我們的思路就會有很多。就如同猴哥的作文預測刻舟求劍或搜索等話題,看起來很難入手,其實按照我們的分析思路,仍然逃不掉經濟層面、社會層面、心理層面,進一步細化就是科技領域、環境領域、思想觀念等,哈哈思路呀思路,這才是模板。
  • 雅思培訓機構學為貴推出考研英語業務,教材及課程將陸續上線
    藍鯨教育4月14日訊,近日留學及雅思教育培訓機構學為貴推出考研英語教材及課程。據悉,學為貴是雅思官方白金級合作夥伴,創始人劉洪波為雅思名師。同時,學為貴主打英語培訓教材,憑藉「英語真經體系」,先後出版了涵蓋雅思、託福、GMAT、PTE、大學英語四六級、青少英語等在內的近百本書籍,涵蓋了中國學生全年齡段的英語學習書籍。
  • 2021年考研英語(四六級)作文預測(社會實踐、實習)
    2021年考研英語(四六級)作文預測(社會實踐、實習)分析:社會實踐也是各類英語考試喜歡考的話題,考研也不會輕易放過,不管是直接考實踐還是間接,我們都要引起重視。在考研作文中,和學生密切相關的有學習,專業,就業等,那麼實踐也算學習,並且目前對實踐的要求越來越高。
  • 考研英語考到70分以上竟有這麼多好處!這些你都知道嗎?
    正所謂「得考研英語者得天下」,你信嗎?這篇文章,就是勸你相信。考研英語考到70分以上的好處,你確定都知道?首先,這在複試中一定是加分項,畢竟,研究生不同於本科,在科研的過程中,會遇到很多英文文獻,而考研英語可以考到70分以上的高分,文獻翻譯應該會容易很多;其次,若是沒有通過四六級,這個分數一定是可以彌補這方面的不足;第三
  • 四六級不再提供證書了?|國家公務員考試|英語|...
    第3-8篇文章是12月四六級答案詳解考過四六級的人都懂,有一種痛苦,叫我的四六級考了424分!!!424成了大家最遺憾的分數。為什麼大家都執念於425呢?考多少多分才能拿到四六級證書呢?聽說分數不及格也能過級?這到底是怎麼回事?
  • 考研英語怎麼提高?四六級怎麼通過?單詞實在記不住呀!這有乾貨
    可能是書的排版我不是特別喜歡,在背第二遍的時候,我看到自己身邊有很多同學用的都是朱偉的《戀練有詞》,我就翻看了一下,覺得排版什麼的都讓我有一種又想買又想學習的衝動,而且大家一說起朱偉的網課也是津津樂道,所以我果斷下單買了一本(當時大概是四月中旬左右),書一收到後,我就直接開始一邊聽網課,一邊記憶。其實聽網課,需要耗費大量的時間,所以,我幾乎把課餘時間都用在了英語單詞的記憶和網課上。
  • 升級AI作文批改功能 有道寫作可識別百種英語寫作錯誤類型
    【環球網科技綜合報導】12月9日消息,近日,網易有道推出「有道寫作」,將原有內嵌在網易有道詞典App的AI作文批改功能,延伸至網頁瀏覽器、Word加載項、PC詞典等埠,滿足用戶的多場景使用需求。有道寫作是AI作文批改功能的應用升級,能夠幫助用戶解析文章的拼寫、語法、樣式、詞級潤色等不足,並進行智能修改實現英文寫作。在2020年年中時,AI作文批改功能正式落地網易有道詞典App,該功能是繼有道神經網絡翻譯後,網易有道推出的又一重要的人工智慧技術應用。