人工智慧機器人的數學「高考」輸在語文上

2020-12-13 中國青年報

  6月7日晚,人工智慧機器人AI-Maths正在解答2017年數學科目高考試卷,研發負責人接受記者採訪。當日,AI-Maths分別花了22分鐘和10分鐘,答完北京文科卷和全國Ⅱ卷,分別得了105分和100分。中國青年報·中青在線記者王鑫昕/攝

  11個黑色方盒子被裝在一臺一人多高的機櫃裡,身後連著密密麻麻的電線、網線,設備嗡嗡作響,信號燈不停閃爍,旁邊兩臺空調正在抓緊工作。如果室溫超過25攝氏度,這11臺伺服器將可能宕機。

  這是6月7日傍晚,發生在成都高新區一個創業園區內的場景。「準星數學高考機器人」AI-Maths在這裡迎來了屬於它的2017年文科數學「高考」。

  這是人工智慧向人類發起的最新一場挑戰。此前,谷歌公司旗下DeepMind公司研發的人工智慧機器人AlphaGo先後戰勝頂尖棋手李世石和柯潔,引發了人們對人工智慧會不會超越人類這一話題的熱議。

  斷網、斷題庫,閉卷考試

  AI-Maths是在一個與網際網路隔絕的空間進行答題的。研究人員強調,AI-Maths不是依靠數量龐大的題庫進行比對、作答的,它主要靠系統學習知識點,形成邏輯推理能力後進行自主解題。

  由於涉及試題保密,機器人無法與全國考生同時、同場競技。考試現場,數十位工作人員在緊張「備戰」,焦急地等待網絡上更新高考試卷。記者的長槍短炮已經包圍了這些可能的信息來源。現場緊張感十足,哪怕一點響動都能吸引一批人探尋的目光。

  研發AI-Maths的成都準星雲學科技有限公司負責人稱,這是人工智慧第一次向複雜綜合推理技術發起挑戰。此前,研究人員為它設定的考試目標是110分。而在今年2月的一次模擬考試中,它只獲得了93分,剛過及格線。

  在過去3個多月的魔鬼訓練裡,AI-Maths的做題數量從起初的100套試卷增加到大約500套試卷。

  這是它「一個人的高考」。考場中只允許它獨處,不能有任何人為幹涉。它不能像其他機器人小夥伴一樣,靠連接網絡資料庫和題庫獲得答案,一切都憑藉那11臺伺服器。它必須獨立完成讀解、計算,與普通考生無異。

  成都準星雲學科技有限公司CEO、清華大學蘇州研究院大數據中心主任林輝向記者表示,聯網、聯題庫的狀態下答題,就像一位考生在自由開放環境下的開卷考試,目前市場上已有很多應用。但AI-Maths要做的是模仿考生封閉環境的閉卷考試,現場到處貼著「所有設備斷網斷庫」。

  為了讓這場考試對人類更公平,林輝邀請了三位專家擔任「監考官」,從斷網情況到用於拷貝試題到伺服器上的U盤是否夾帶「小抄」,他們都在眾多直播鏡頭下現場完成檢查。

  17時45分,一位工作人員在會場最後方的錄題區域喊了一聲:試題來了!工作人員當即宣布,AI-Maths將挑戰的首套高考試卷是文科數學北京卷。十幾位錄題、檢查人員在會場後方,抓緊將從網上獲取的圖片格式試題輸入進WORD文檔。再過一會兒,這份「考卷」將進入AI-Maths的「大腦」。

  為了這次實戰,錄題的工作人員試驗過多次。林輝向中國青年報·中青在線記者介紹,就在正式考試幾天前,第一次錄題時,很多工作人員曾緊張得雙手發抖,頻頻出現失誤。一旦錄題不準確,AI-Maths的「高考」將失去價值。

  在林輝看來,工作人員的緊張再正常不過。在很多人心中,跟人工智慧機器人的對戰顯得有點「悲壯」。在今年2月AI-Maths與成都某知名中學學生的「對戰」前,一名學生甚至感覺自己是「代表人類在作戰」。

  機器人的失分之處在於無法讀懂自然語言

  18時28分,AI-Maths正式開始作答北京卷。在會場前方的8臺電腦承擔著向「考場」內11臺伺服器導入試題和導出答卷的功能。

  大屏幕上原本顯現的AI-Maths孤零零佇立在考場中的畫面,變成了答題過程的實時呈現。從選擇題開始,屏幕迅速滾動,答案就實時展現在真題的右方。

  到了解答題,現場的氣氛更加緊張。此前,大家從沒見過AI-Maths將如何讀解包含眾多文字描述的大題。它會寫過程嗎?能得到過程分嗎?它的解題思路跟人類一樣嗎?

  1、2、3……AI-Maths將每一個步驟用數字順序標明。如果第五步使用的是第一步和第三步的結論,它將顯示為:「由條件(1)和(3)得」,後接運算結果。

  按照AI-Maths過去的「倔強勁兒」,它可能有時會卡在一道題目上幾小時不止。那時它沒有知難而退的意識,對於解不出的難題,一種方法不行,它就會嘗試下一種方法,有時甚至會為一道題嘗試好幾百次。所以研發團隊專門設置了一個放棄程序,以確保AI-Maths不卡在一道題目上而耽誤了後面的解題進程。

  22分鐘後,工作人員宣布AI-Maths已完成北京卷。他們迅速列印它的答卷,並在鏡頭的見證下交由坐在會場左側等待判卷的3位數學教師。他們都是來自成都幾所知名中學的教學帶頭人。

  在北京卷的判卷過程中,第二套試卷全國II卷也開始了人工錄入階段。

  19時許,現場工作人員宣布了AI-Maths的首套高考答卷的成績:105分!選擇題滿分!現場響起了熱烈的掌聲。

  105分的數字通過現場觀眾擴散到了網上。看到這個成績,一些網友留言表示「我這輩子都沒到過105分」,也有人質疑:為什麼AI-Maths不答難度更高的理科數學?早早地做完題為什麼不檢查一下錯題?

  19時19分,AI-Maths開始作答全國II卷。林輝拿著AI-Maths的答卷現場解析它在一些題目中得零分的原因。比如北京卷第14題,林輝覺得自己初次讀題都「有點暈」。

  他認為,題幹中「教師人數的兩倍多於男學生人數」的表述並不常見,AI-Maths很可能由於無法理解這種描述,故而無法解答,得了零分。「主要是自然語言理解出現了問題。」林輝表示。

  在林輝介紹間隙,工作人員宣布,19時29分,AI-Maths僅用10分鐘便完成了答題。現場爆發出一片驚嘆聲。很快,閱卷結束,這次AI-Maths的得分是100分。

  這次,AI-Maths的答卷上紅叉落在了選擇題第九題上。這是一道講述甲乙丙丁4人向老師詢問成語競賽成績的邏輯推理題。除了「2位優秀、2位良好」的信息涉及數字,其他都是純文字表述。

  閱卷老師隨後告訴記者,AI-Maths的失分主要在於概率統計題等文字表述較為複雜的題目。它主要問題還是出在了讀不懂題上。用參與閱卷的數學老師的話說,AI-Maths要考好數學,還得先學好語文。

  儘管沒能達到110分的目標,研究團隊依然感到驕傲。科大訊飛研究院院長胡國平說,據他所知,這是人工智慧第一次在斷網斷庫的情況下完成自動解題。類比聞名世界的AlphaGo,前者更多地屬於計算智能的範疇,AI-Maths要解決的是認知智能層面的問題,也是目前人工智慧與人類差距最大的領域。

  研究人員相信,經過更多的訓練和學習以後,未來AI-Maths會取得更好的成績。林輝透露,在過去一年中,公司在複雜邏輯推理、直覺觀察推理、計算機算法、深度學習上都進行了深入攻關。

  「思維能力就像是人在成長時的肌肉,要先訓練力量,再去訓練招式、套路。」林輝說。接下來,他們將繼續讓AI-Maths「復讀」,做更多的題進行訓練。「待它更強大時,再進行聯網、聯資料庫。否則AI-Maths靠的都是人的經驗,永遠無法超過人類!」

  林輝希望,AI-Maths有朝一日能完成從學生到出題人、閱卷人身份的轉變。他告訴中國青年報·中青在線記者,本次使用11臺伺服器,為的不是展示技術的力量,而是希望AI-Maths可以用更接近日常生活的設備條件來發展自己,從而便於未來更廣泛地應用於日常生活。

相關焦點

  • 機器人的數學高考輸在語文上 自然語言識別成難題
    6月7日晚,人工智慧機器人AI-Maths正在解答2017年數學科目高考試卷,研發負責人接受記者採訪。當日,AI-Maths分別花了22分鐘和10分鐘,答完北京文科卷和全國Ⅱ卷,分別得了105分和100分。
  • 22分鐘得105分 成都高新造人工智慧機器人挑戰高考數學卷
    6月7日,2017年全國高考拉開帷幕。下午5時之後,也就是高考數學科目結束之後, 「成都造」人工智慧系統「準星數學高考機器人」 AI-MATHS,對2017高考數學科目發起了挑戰,並且22分鐘做完高考北京文科數學卷,得105分;10分鐘做完高考全國文科數學卷II,得100分。
  • 尷尬了 | 「高考機器人」數學成績敗給文科生,網友:可見高考有多難!
    比如被列入國家「863超腦計劃」的「數學智能解題機器人項目」,從2015年立項,到去年5月完成重大技術突破,一直備受大家的關注。今年2月底,成都石室天府中學僅有的兩個文科班的同學們進行了一場數學考試,與平時不同的是,一臺人工智慧機器人也參與其中。
  • 機器人能高考?語文數學英語全是程式設計師教的
    再過兩天,就是舉國關注一年一度的高考了。關於高考,除了回憶中那個炎熱的夏天、吐槽各個地區的作文題目之外,你是否想過,如果能有個機器人替你參加高考,那還不是清華北大任選?那麼在AI如此熱門的情況下,你認為,在2020年人工智慧能否通過高考?相當多人會認為:「當然!」畢竟阿爾法狗不留情面地戰勝了柯潔。
  • 機器人參加模擬數學高考得105分
    新華社成都6月7日電(記者王迪)7日下午,當考生們走出高考的考場時,他們或許不會想到,他們的「競爭者」還包括一臺人工智慧機器人。22分鐘內,在沒有網絡和題庫支持下,它完成了一張北京文科數學考卷,得分105分,而滿分是150分。在同樣封閉的環境下,中國考生需要用兩小時完成同樣的試卷。
  • 成都造人工智慧機器人首戰高考數學 2套試卷最高獲105分
    成都造人工智慧機器人首戰高考數學 2套試卷最高獲105分 2017-06-07 21:57:42來源:中國新聞網作者:${中新記者姓名
  • 高考數學有多難?機器人竟敗給文科生
    2月23日,成都石室天府中學高三文科班的43名學生迎來了一場「人機大戰」,他們的對手是由國家863超腦計劃研製的「高考機器人」,這也是研究4年多以來,「高考機器人」首次與學生進行對決。據成都商報報導,2月下旬,成都石室天府中學高三數學老師蔣奎向學校僅有的兩個文科班的學生們宣布了一個消息:23日,他們將進行一場數學考試,與平時不同的是,一臺人工智慧機器也將參考,與他們一比高下。「對方的人工智慧(智能到何種程度)我不太了解,只知道它是不聯網的。」蔣奎告訴記者,他對自己的學生很有信心。
  • 中國版人機大戰:機器人明年高考 它的難處你不懂
    前些日子,人工智慧機器人AlphaGo賺足了大家的眼球,引發全民探討人工智慧的熱潮。昨日消息稱,2017年的文科高考生們即將迎來另一位人工智慧競爭對手——高考機器人。由國家863超腦計劃牽頭研製的高考機器人將參加明年高考的語文、數學和文綜三項科目的考試,它的目標是要超過重點本科分數線。
  • 人工智慧做數學還得跨過辨識應用題這道檻
    人工智慧做數學還得跨過辨識應用題這道檻 高考機器人並不呈人形,而是這麼一個龐然大物。「成都造」高考機器人AI-MATHS的數學高考成績出來後,還有一長串問題待解:為何只考數學?滿分150分,人工智慧為何拿不到滿分?這場考試對相關行業意味著什麼?人工智慧產業在川發展情況如何?A 看考試為什麼只考數學?
  • 抱歉,學IT人工智慧或機器人都要中學基礎知識打底
    一年一度的高考,是一屆又一屆的莘莘學子跨越的轉折點。而紮實的中學知識,往往又是高考學子考出好成績的基礎。但對於你我大學畢業了的職場人或打工者而言,也許也不能置身事外,中學課本裡那些知識,依舊是我們不能忽略的東西。學校知識有什麼用,還不是只為了應付考試?
  • 挑戰高考作文慘敗,人工智慧僅限插科打諢?
    6月7日,高考第一科語文考試結束之後,全國各地高考作文題陸續公布,引來網絡上各路大V名家的解讀,搜狐教育頻道提前一天宣布將邀請人工智慧微軟小冰和中國人民大學教授張鳴、80後作家安意如、專欄作家潘採夫、詩人廖偉棠等10位名家一起在規定時間內完成高考作文,這是人工智慧第一次嘗試中國高考作文寫作。搜狐教育頻道上這一話題的閱讀量截至6月7日下午已經達到了307萬。
  • 當機器人高考數學得了134分,我們聊聊它與人族「學霸」的區別以及...
    但就在考場之外,另一場數學「大考」剛剛開始。而面對考試的,則是和普通學子不同的特殊考生——人工智慧。在成都高新區天府新谷的一個封閉空間裡,一位機器人「考生」挑戰了今年全國高考的數學。它是成都準星雲學的高考機器人,名叫「AI-MATHS」。
  • 機器人做北京高考數學卷,22分鐘考了105分
    因為今年高考,除了上面的話,爸媽們有了新的句子可以嘮叨:「你要考過機器人,才能上大學啊!」「你連一個機器人都考不過,還想上大學?」「養你還不如養一臺機器人,人家還會高考呢!」谷歌AlphaGo與柯潔的對弈給人類帶來的恐懼還沒有消散,這邊機器人又在高考試題上大顯神威。成都高新區一科技公司研發的一款人工智慧系統AI-MATHS作為「數學高考機器人」,昨天就挑戰了2017高考數學卷。
  • 機器人寫高考作文,勝算幾何
    四川成都高新區一家企業表示,他們研製的機器人將挑戰張一一這位「中國著名考生」。在「阿爾法圍棋」擊敗李世石、柯潔等圍棋高手後,質疑機器計算能力的聲音明顯減弱了。2017年高考,機器人AI-MATHS在總分150分的數學卷中拿了134分,也沒有讓人驚訝。但是,圍繞機器人能力的爭議並未停止,不少網友表示,機器人的寫作水平若能戰勝作家,那才說明人工智慧真的厲害。
  • 機器人加入高考大軍,未來高考狀元不是人?
    6月7日下午5時20分許,在成都高新區,人工智慧系統將再次挑戰人類!「準星數學高考機器人」AI-MATHS,挑戰2017年高考數學科目。AI-MATH是什麼?AI-MATHS誕生於2014年,是成都高新區一家本土人工智慧企業——成都準星雲學科技有限公司,依託清華大學大數據、人工智慧、自然語言識別等前沿技術,研發的一款以自動解題技術為核心的人工智慧系統。AI-MATHS其「身體」並非模仿人類的樣子,而是10餘臺伺服器,其「大腦」就是伺服器上承載的人工智慧系統。
  • 人工智慧課進入小學和初中 機器人交警上崗
    同時在試點實驗的基礎上,廣州市還將在全市開展3-8年級人工智慧校本課程教材研發及送審工作,進一步推動廣州市智慧教育示範區課程建設,實施廣州市智慧教育示範區AI+創新工程。  高考連續多年涉及編程題  十年寒窗為高考,2019年高考編程題再次出現。  全國一卷理科數學
  • 要逆天 成都機器人答北京文科高考數學卷花22分鐘得了105分
    2017年高考數學科目的考試結束後,人工智慧機器人 AI-Maths在成都高科新區天府新谷園區內,先後作答兩套高考數學試題,經過2小時緊張的解題、等待、評分後,AI-MATHS此次模擬高考成績為:2017年高考北京文科數學卷獲得105分,用時22分鐘;2017年高考文科全國卷II獲得100分,
  • 【吐槽】國產機器人明年將參加高考 !
    隨著人工智慧的發展,現在越來越多的有著特殊技能的機器人出現在了我們的面前,不過日前一個機器人引起了不少學生的注意,因為這是一個高考機器人!而這款機器人將參加2017年的高考,目標則是考上一本。當然不少網友都表示中國教育已經培養出這麼多「機器人」,還弄這個有什麼意思?企鵝娘認為雖然在數理化上機器人有著天生的優勢,但是在各種刻意鑽牛角尖的語文閱讀理解上,生硬的機器人真的能夠理解那連作者自己都沒覺察到的「隱喻」「寫作情感」「背後深意」嗎?
  • 機器人10分鐘考了100分
    機櫃裝有11臺伺服器承載著AI-MATHS的「大腦」   昨日,全國高考開考,成都一名特殊「考生」——「準星數學高考機器人」AI-MATHS,在多位技術專家、近百家媒體以及廣大網友的見證下,連續挑戰了兩套今年的高考數學考卷
  • PK高考理科狀元:機器人成績134分 6名狀元平均分135分
    40年後,從高考走出的一代又一代學子正在不斷探索科技的新前線——在人工智慧領域,科學家們正在努力讓機器通過「高考」,創造能適應時代發展的機器智能。這個夏天,正在高考如火如荼的舉行之時,國內一些前沿的技術公司、教育公司都發起了讓機器人挑戰高考的活動,比如科大訊飛、學霸君和準星機器人等。