AI批改英語作文行不行?雅思考研四六級,打分評語糾錯都得有

2020-12-14 騰訊網

煢煢 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

我,一個科技小編,最近在跟國外大佬的郵件交流中,感到飄過六級後的自己英語寫作水平那真是日漸捉急。

從句怎麼用?時態對不對?看著對面主編犀利的目光,那一瞬間,真想問問自己為什麼不good good study, day day up。

於是,我決定了,我要好好學習英語寫作!

想要提升水平,不自己動筆寫總是差那麼點意思。

那麼,問題來了:寫的好不好,誰來幫我批改呢?

其實,打從小學開始學英語,小學、中學、四六級、雅思託福……英語作文怎麼提高從來都是一個難題。

尤其是各類考試,有嚴格的評分標準,可身邊哪能時時有經驗豐富的閱卷老師幫忙有針對性地修改提高呢?

聽聞我的煩惱,一位網易有道的胖友向我招了招手:你看我手機裡這個紅色的App,裡面最新上線了一隻AI,能幫你批改英文小作文喲。

對啊,如果AI真的能準確評分,甚至給出修改意見,那像我一樣的同學們不就能隨時隨地把英語作文練到飛起了嗎?

略一調研,我發現,現在有AI批改英語作文功能的產品還真不少:網易有道詞典、微軟愛寫作(小英)、批改網、Grammarly……

想到現在宅在家裡的大朋友、小朋友可能也有同樣的困擾,我決定親自測試一下這些AI們到底靠譜不靠譜。

AI批作文,到底哪家強?

初篩一番,我挑選出了幾個免費、容易上手使用的選手參與測評,分別是:網易有道詞典AI作文批改,微軟愛寫作,以及Grammarly免費版。

那麼,話不多說,讓我們直接進入比賽。

Round 1:手寫識別

像小學中學英語考試、四六級以及考研英語、雅思託福考試,實際應試時都需要在紙面上進行寫作,因此在練習時,同學們也往往會選擇手寫。

寫完一遍,再打一遍字,未免有些麻煩,如果拍張照,AI就能自己識別我到底寫了什麼,那就方便多了。

有道AI作文批改和微軟愛寫作均支持圖片識別功能。而Grammarly……由於沒有這一功能,這位選手選擇暫時退場。

我使出洪荒之力,用非標準應試字體謄寫了一篇作文,測試兩位選手。

先來看有道AI作文批改的表現:

識別得相當準確,有塗改的地方也沒有出現誤識別的情況,為數不多的幾個需要手動修改的地方,基本上都是手寫時字母和字母之間空格太大,因此識別時成了兩個單詞。

再來看一下微軟小英的結果:

由於我沒寫標題,小英強制把第一段都識別成了標題。忽略掉這一點的話,識別準確率也很高。但對於標點符號的識別不及有道AI作文批改敏感(上圖紅色標註處)。

還有個小問題:如果你把兩個詞寫得比較開,小英會識別出多餘的空格,檢查得不仔細的話,會影響下一步評分的準確性。

另外,相比於只有網頁版的微軟愛寫作,手機端的有道詞典可以直接拍照識別,無需再倒一手把照片傳到電腦上,還是要方便一些。

Round 2:糾錯能力

如果說OCR只是影響用戶使用方便與否的細節,那AI批改作文的重點,當然在於能不能準確抓住作文中的bug。

有道AI作文批改、微軟小英和Grammarly都有識別文中語法錯誤並給出修改意見的功能。

這一輪,我們用一些單句來測試一下誰的Debug能力更強。

例句一:When the girl will leave, she fount an old begger in the tree and looked at angry and cold.

有時態錯誤,也有拼寫錯誤。

有道揪出了4處錯誤:

具體的判斷是:疑似用詞不當,建議將「will leave」修正為「left」;疑似動詞時態錯誤,建議將「fount」修正為「found」;疑似名詞誤用,建議將「begger」修正為「beggar」;疑似介詞「at」冗餘,建議刪除。

把問題拋給微軟小英,它也同樣找出了這4處錯誤,並給出了一個單詞替換建議。

具體判斷是:錯誤動詞時態,將「will leave」改為「left」;動詞用法錯誤,將「fount」改為「found」;單詞拼寫錯誤,將「begger」改為「beggar」;冗餘,刪除「at」;建議將「cold」換成「bitter」、「hard」、「mean」。

最後看一下Grammarly的判斷。

Grammarly免費版指出了一處單詞拼寫錯誤,並建議我升級付費版。

同樣,在「But this stress didn’t stop me from thinking to attend the biggist activity in our school」這個句子中,有道和小英都指出了3處錯誤:

介詞「to」改「about」;動詞「attend」改「attending」;「biggist」拼寫錯誤,改為「biggest」。

而Grammarly免費版還是僅僅指出了「biggist」這個拼寫錯誤。

看來,就免費體驗來說,Grammarly的語法修改偏於簡單了。

最後,給有道AI作文批改和微軟小英出一個加試題。

例句二:On a cold morning, while I was watching a girl buy bread and milk in the fiont for me.

對於AI而言,這個句子的識別難點在於,同一個對象涉及了多個錯誤,「fiont」這個拼寫錯誤後面,緊跟著「for」這個介詞使用錯誤。

面對這一題,有道成功把「in the front of」這個整體識別了出來,既指出了拼寫錯誤,也發現詞組中介詞的錯誤。

而微軟小英的改法令人有些看不懂,難道是感應到了句子裡主人公的內心戲?

這輪比拼結束,小小總結一下。

同樣是免費,Grammarly免費版相比於兩位中文世界的選手,差距有點大。

不過,Grammarly有插件版本,直接寫郵件的時候,能夠邊寫邊糾錯。

但如果是想要在AI的幫助下提升英語寫作能力,Grammarly免費版恐怕不是上佳選擇。

而有道AI作文批改和微軟小英,都更符合國內的英語學習路徑,總體表現都還不錯。不過,在錯誤複雜度提高的時候,有道的表現略勝一籌。

Round 3:評分準確度

另一個重點,是評分的準確度。

畢竟,考試都有嚴格的評分標準,能否依據標準給出準確的打分,對於廣大有應試需求的同學們而言還是非常重要的參考指標。

有道AI作文批改和微軟愛寫作,都支持多學段英語作文批改,涵蓋小學、初中、高中、四六級、雅思託福和考研英語。

至於Grammarly,作為一款「舶來」應用,並不是很適合我考試大國的風格,沒有推出打分功能,亦無法區分學段和考試類型。

不過,使用Grammarly,也可以針對自己的情況進行一些個性化設置,包括Audience(受眾)、Formality(正式程度)、Domain(領域)。

問題還是,免費版選擇有限。

我在網上找了一篇 7.5 分的雅思範文,人類老師對這篇作文的評價是:詞彙豐富、語法點豐富,並且論證全面。

那麼AI會如何評價這篇作文呢?

還是先來看看有道AI作文批改的答卷。

有道給這篇作文打了8分,並且就詞彙、結構、語法和內容都給出了評級。

點擊查看點評,還能看到AI閱卷官從詞、句、篇章著手,對作文的總體評價,一些更高級詞彙的推薦,以及好詞的鞏固。

……詞彙量較為豐富……文章較為流暢……詞彙基礎紮實。

這樣的評語,與人類老師的判斷基本一致。

同樣一篇文章,我們來看看微軟小英怎麼說。

同樣給出了8分,比較特別的是,小英會統計作文中所使用的考綱詞彙、邏輯連詞和從句數量。

與有道給出的總體評價報告不同,小英給出的是文章結構、句間關係、切題程度、展開程度4個評價指標。

需要注意的是,如果想參考文章內容中切題程度這個指標,必須填寫文章標題。而展開程度這個指標,我反覆試了多篇作文,從高考範文到雅思範文,都是穩定一星……

這輪比拼結束,同樣做個小結。

總體而言,有道和小英的評分結果都根據考試類型的不同,與考試評分標準對齊,具有參考價值。

在細節上,有道會根據字數、詞彙使用情況、語句邏輯及銜接等方面給出綜合評價,微軟小英則是分點給出建議,主要集中在文章結構和句間關係兩個方面。

不過,在測試中微軟小英出現了一些小bug。

比如六級作文的滿分是15分,但在得分界面其最高分卻是25分。

背後技術

看來有道詞典批改作文的AI,確實有兩把刷子。

出於科技小編的好奇心,我向文章開頭給我推薦軟體的胖友打聽了一下,在這背後究竟是怎樣的技術。

以有道為例,其英語作文批改分為三個核心模塊:評分模塊 + 評語模塊 + 糾錯模塊。

評分模塊負責提供總分,及詞彙、語法、結構得分,採用的是傳統方法 + 深度學習方法。

評語模塊提供全文評語、詞彙推薦、範文推薦。

糾錯模塊提供14個類別的語法錯誤識別及修正,包括淺層的拼寫錯誤、深層的語法錯誤等。

其中,拼寫糾錯運用的是基於BERT的NER實體識別技術。

語法糾錯,則被定義為序列到序列的生成問題。核心基於Transformer架構。

核心模型所做的事,其實類似於翻譯:將語法錯誤的句子翻譯成語法正確的句子。

此外,在語法糾錯中,還採用了遷移學習和對抗學習。用真實語料和基於真實用戶錯誤分布生成的海量偽語料,不斷提升模型能力。

以上是網易有道詞典的質量評估結果。P值為精確率(Precision),R值為召回率(Recall),F0.5為P值與R值的調和平均,其值越高,通常表示算法性能越好。

可以看到,有道AI作文批改的測試結果已達行業領先水平。

好啦,看罷這一篇試用報告,不知道正備考四六級、雅思託福、考研英語的你願意pick AI為你免費批改作文嗎?

今天先醬,有其他煩惱需要評測AI工具,也可以留言區跟我說哦~

— 完 —

相關焦點

  • AI批改英語作文行不行?免費,覆蓋雅思考研四六級,打分評語糾錯都得有
    於是,我決定了,我要好好學習英語寫作!想要提升水平,不自己動筆寫總是差那麼點意思。那麼,問題來了:寫的好不好,誰來幫我批改呢?其實,打從小學開始學英語,小學、中學、四六級、雅思託福……英語作文怎麼提高從來都是一個難題。
  • 雅思考研四六級,打分評語糾錯啥都有,有道AI能幫改英語作文了
    於是,我決定了,我要好好學習英語寫作!想要提升水平,不自己動筆寫總是差那麼點意思。那麼,問題來了:寫的好不好,誰來幫我批改呢?其實,打從小學開始學英語,小學、中學、四六級、雅思託福……英語作文怎麼提高從來都是一個難題。
  • 網易有道詞典上線AI作文批改功能,可自動批改雅思、四六級英語作文
    藍鯨教育4月8日訊,近日,網易有道詞典推出新功能「AI作文批改」,通過人工智慧技術自動批改英語作文,幫助各個學段學習者檢測作文水平,提升英語寫作能力。使用者可直接拍照或手動輸入需批改的作文,以拍照批改為例,可選擇照片庫中提前拍好的作文圖片,或直接對手寫作文進行拍照。系統會錄入和識別具體內容,識別後也支持手動修改調整後再做批改。有道詞典AI作文批改會從詞、句、篇章多個維度,對英語作文進行打分和批改,並生成報告便於後續學習提高。
  • 網易有道詞典上線AI作文批改功能 可自動批改雅思、四六級英語作文
    「確認提交「後,有道詞典AI作文批改會從詞、句、篇章多個維度對英語作文進行打分和批改,並生成個性化報告便於後續學習提高,可以說比真實的英語作文批改老師更貼身、更細緻。 四六級雅思託福都可以 專業與細緻程度面面俱到 網易有道詞典AI作文批改針對不同的英語寫作學習要求劃分了小學、初中、高中、大學四六級、雅思、託福等涵蓋K12、大學、成人等全學段人群,不同學段的分數設定和評判要求與考試標準一致。
  • 有道詞典上線AI作文批改功能 可自動批改雅思、四六級作文
    據悉,有道AI作文批改基於網易有道神經網絡機器翻譯,使用Transformer架構等核心技術,建立複雜模型實現針對不同場景進行性能調優。通用的評價標準可從批改精確率、召回率等關鍵數據進行測評。網易有道詞典AI作文批改功能主要由三個核心模塊構成:評分模塊、評語模塊和糾錯模塊。
  • 網易有道詞典推出AI作文批改功能 專業度堪比高考閱卷老師
    網易有道詞典AI作文批改高考作文,一鍵拍照識別手寫作文點擊「確認提交「後,有道詞典AI作文批改會從詞、句、篇章多個維度對英語作文進行打分和批改,並生成個性化報告便於後續學習提高,可以說比真實的英語作文批改老師更貼身、更細緻。
  • 像老師一樣改英文作文,有道 AI 是怎麼做到的?
    考試中的英語作文,佔分比例大,對綜合素質要求高,雖說不是所有人的痛,但也一定是很多學生要邁過去的一道坎。為了提高英語作文水平,有的人會選擇去報班,也有人會上網去問。如今,隨著技術成熟,有了更智能更簡便的方式:讓 AI 來批改你的作文。事實上,機器批改作文這事並不新鮮,但以前的工具和英語老師一比,差距就凸顯出來了。
  • 假如讓AI來批改英語作文……
    但對於寫作的環節,我們卻很少有機會得到訓練。書面交流不僅更要比口語更遵守語法規則,還對一個人的詞句篇章、構思邏輯等有更高的要求。同時,寫作環節的反饋,會耗費更多的精力和時間。為了解決英語學習者在寫作上的難點和痛點,近期,網易有道詞典上線了以人工智慧驅動的批改英文作文的功能——AI作文批改。
  • 有道詞典推出全新AI技術 一鍵自動批改英語作文
    據悉,有道詞典AI作文批改針對不同的英語寫作學習要求劃分了小學、初中、高中、大學四六級、雅思、託福等涵蓋K12、大學、成人等全學段人群,不同學段的分數設定和評判要求與考試標準一致。隨後,用戶可以直接拍照或者手動輸入需要批改的作文。
  • 讓英語作文更精彩的智能批改工具
    點擊左上角關注我們 在英語學習中,寫作是對詞彙、語法、閱讀、表達的全方位考察,可以很好地反映學習者的語言綜合素養。然而,如何實現對英語作文快速準確地評判並給予反饋,成為學生、老師、家長們共同面臨的難題。現在,小編為你介紹一種新方法:讓 AI 來批改你的作文。
  • 微軟免費AI作文打分軟體升級:雅思考研四六級都能用,還能查單詞給...
    賴可 發自 亞灣區 量子位 報導 | 公眾號 QbitAI 練習英語寫作一大困難就是:沒有人幫我改。 現在可以找AI打分了。
  • 考研英語作文免費批改平臺推薦
    昨天有同學問到批改寫作的平臺: 396我不清楚,但英語寫作倒的確有一些免費平臺可以分享給大家。只不過得提前講一下,這些畢竟都是機改,難免有紕漏與缺陷,只能達到基本的要求;不要過於依賴。
  • 英語作文批改 到底哪家強?
    句酷批改網的核心算法是計算學生作文和標準語料庫之間的距離,再通過一個映射將距離轉化成作文分數和評語。針對不同的考試類型使用不同的打分公式,每個打分公式有 192 個獨立可測量的參照指標,最終系統會選擇十幾個和作文分數相關性最高的指標來打分。
  • 用機器批改英語作文?「句酷批改網」做的就是這樣的事
    而從去年到今年,似乎教育領域也在接受這一趨勢,原本重度依賴人工的作文批改,現在網際網路人也想將它們自動化——比如申論作文的批改,比如英語作文批改。  句酷批改網就是提供英語作文批改服務的公司。他們的服務面向大學老師以及學生(去年拓展到高中生),通過訓練打分引擎,使之可以自動按照四六級考試、高考以及中考的作文評分標準,來自動批改學生的作文、給出評分,並在有語法、用詞、表達不規範的地方給予反饋提示,給學生修改的建議。
  • 用機器批改英語作文替代人工批改,「句酷批改網」想讓大學生以最高...
    而從去年到今年,似乎教育領域也在接受這一趨勢,原本重度依賴人工的作文批改,現在網際網路人也想將它們自動化——比如申論作文的批改,比如英語作文批改。句酷批改網就是提供英語作文批改服務的公司。他們的服務面向大學老師以及學生(去年拓展到高中生),通過訓練打分引擎,使之可以自動按照四六級考試、高考以及中考的作文評分標準,來自動批改學生的作文、給出評分,並在有語法、用詞、表達不規範的地方給予反饋提示,給學生修改的建議。
  • 微軟免費AI作文打分軟體升級:雅思考研都能用,還能查單詞給替換
    賴可 發自 亞灣區量子位 報導 | 公眾號 QbitAI練習英語寫作一大困難就是:沒有人幫我改。現在可以找AI打分了。亞洲研究院研發升級了以前的作文打分功能,命名為「微軟愛寫作」(Microsoft Aim Writing)。從小學到到雅思託福的作文都可以改。量子位第一時間幫大家試用了一下,心情有點複雜,不知道以後要不要拿它改作文。
  • 2020年最全最新英語作文評分標準及要求(乾貨含考研、四六級)
    中考英語作文評分標準考研評分標準 :考研分為英語一和英語二,滿分和評分標準都有所不同,需要格外注意。考研英語評分標準四級、六級評分標準:四、六級作文字數要求和評分標準都有所不同,批改時需要格外注意。四、六級英語作文評分標準雅思作文評分標準:
  • 批改作文這件事,AI 比你的英語老師強在哪裡?
    經歷過那個時期的人應該都明白,考試前一點小小的變動,都有可能對心態、臨場發揮產生重大影響,更別說新冠病毒這樣世界性的難題。對於一些有明確解題思路和答案的考題,學生藉助參考資料、網絡都能找到解析和答案,在家也能自己複習。但如果是一些發散性的題目,比如高考作文、英語作文,老師的指導和建議可就十分重要了。
  • 網易有道推AI作文批改功能 可自動批改英語作文
    近日,有消息稱,網易有道詞典推出了AI作文批改新功能,其可自動批改英語作文。據了解,網易有道詞典的AI作文批改功能主要是由評分模塊、評語模塊和糾錯模塊三個模塊構成。這三個模塊構成了AI作文批改的檢測、批改、生成報告等多個功能。在網易有道詞典APP中,使用者可以拍照或手動輸入需要批改的作文。
  • 考研英語作文批改服務
    ,很多同學已經開始準備英語作文了,畢竟考研英語一、英語二作文的分數比值還是很大的,英一大小作文30分,英二大小作文25分呢。 聽課、看書和用模板,無論哪種寫作備考方式,關鍵的環節是得有人幫你批閱平時練習的作文,這樣你才能知道你的作文哪裡結構不對,語句不通,用詞錯誤,說一句不好聽的,即便用模板套關鍵詞,你可能都會套錯。作文批閱後你才會在下一次的練習中去改變,去提高,去寫出自己的作文。