機器如何學習?一個老師機器人負責數千名學生,測試100萬道題

2020-12-14 讀芯術

全文共3323字,預計學習時長9分鐘

圖源:unsplash

我們總能聽到機器學習、深度學習、神經網絡這樣的詞,但是你是否清楚這裡的「學習」到底意味著什麼?它只是銷售軟體和服務的營銷詞彙嗎?還是說科學家真的創造了類似人腦的組件並令其在機器內部運行呢?機器會佔領世界嗎?

別擔心,還沒到那個時候。本文就將為你祛魅機器學習,科學家是如何教計算機完成人類的任務,甚至在某些情況下比人類做得還好。筆者將用最直白的話給大家解釋這個問題,努力讓任何領域的人都可以理解。

為什麼需要學習?

在學習開始之前,解決問題離不開算法的編寫。算法只是一組規則,往裡面輸入後得到的輸出即可作為問題的解決方案。

請考慮以下情況:有一個數字列表,要求你按升序排序,有很多算法可以解決此任務。這些算法通過獲取列表,執行一些規則和操作,然後返給你排好序的列表。對於計算機科學家來說,這種問題「很容易」解決。他們只需要思考並提出一種算法來解決任務。

但同時,有些問題不是那麼容易用算法解決。人們開始對計算機有了更多的要求,他們希望機器具有解決艱巨任務的超能力,是那種連科學家都完全不知道如何編程的任務。

例如:如何編寫一種算法,以獲取動物的圖像並輸出其類型?對於人類而言,這是一項非常容易的任務,但對於算法來講就是一件很複雜的事兒了。人類知道如何對動物照片進行分類,但是他們不知道如何描述他們為獲得答案所採取的步驟。因此,出現了一個重要的問題——如何解決連人類都不知道如何描述的問題?

算法的世界!

網際網路中,算法無處不在。你正在閱讀本文,是因為有一種算法把這篇文章呈現在了你眼前,可能是因為你點擊了什麼,然後算法會記錄你打開的連結。該算法決定了你搜索查找照片所看到的內容,甚至可以為你製作一個小電影。

股市充滿了算法,交易需要進行。當你購買東西時,該算法確定價格,並且在你的帳戶監視交易是否遭到欺詐。

這些小小的算法塑造了你的世界。當它們在過去的人造算法機器人中工作時,人類可以提供「如果這樣,那麼該那樣」形式的解釋說明。但許多問題太大而又難以簡單闡明,例如在一秒鐘的十億次金融交易中發現欺詐性交易,算法能想辦法發揮作用。

圖源:unsplash

設想,一個航空公司如何設定飛機座位的最高價?用戶現在要支付的價格由算法機器人確定。雖機器也並不完美,但比人類能做到的要好得多!沒有人知道,甚至建造它們或將來將要建造它們的人都不知道他們是如何做到的。

人工算法的失敗

圖片中是什麼?是蜜蜂,還是3?對於人類來說,即使是小孩子也很容易說出答案,但用一種機器人語言(一種邏輯門語言)告訴機器人就不太可能實現了。

不是3
不是蜜蜂

我們只知道那是蜜蜂和3,我們可以用言語來區分它們,但是機器人無法理解言語,而正是大腦中的聯繫才使我們分清二者。

雖然我們大腦中的單個神經元可以很容易被理解,但是組成大腦的神經元簇卻很難被理解。雖然我們無法理解這個整體,但是它起著潛移默化的作用。所以,要想讓一個機器人在蜜蜂和數字3之間進行分類,你不需要直接建造這樣的機器人,只需要建造一個建造機器人的機器人和一個教授機器人的機器人。這些機器人的大腦十分簡單,一個優秀程式設計師可以輕而易舉做出來。

記住,建造機器人是用來建造的,但教師機器人並不用於教學,只用於測試學生機器人。

訓練有素的教師機器人

實際上,學生機器人並不擅長測試。起初,建造機器人在任意機器人的大腦中進行隨機連接,於是教師機器人接收到了一些非常特殊的學生機器人,教師機器人需要教他們如何區分蜜蜂和數字3。人類首先需要給機器人老師一堆蜜蜂和數字3的照片,並告訴他們這是什麼。

學生機器人參加了測試,但他們做得不好。這不是他們的錯,他們被建造時就是這樣的。他們被重新帶回建造機器人那邊,那些做得好的會被放在一邊,其他的則會被回收利用。

建造機器人仍然不擅長建造機器人,但現在它將那些做得好的機器人留下來,並用新組合的變化進行複製,然後送回學校。新的學生機器人到了之後,老師機器人一次又一次地測試它們,建造機器人一次又一次地建造,平均測試分數一次又一次地提高,先是60%,最後直到99.99%的完美。

以前,人類可以為他們的機器和機器人編寫算法,但現在,我們做到了讓機器通過任務模式進而創建自己的算法

所以一個測試和試錯的方法已經完成了,這並不是針對一個或兩個機器人,而是針對十億個不同的機器人,有不同的隨機連接,而且測試題又有十億頁長。如前所述,這是針對那些bot語言中存在的問題,那些我們無法告訴機器人的問題。

人類無法訓練的機器人

老師機器人並不是在監管一個有十幾個學生的老校舍,而是一個有幾千名學生的無限倉庫,考試不是10道題,而是100萬道題,他們究竟考了多少次?

無限校舍

建造機器人會不斷重複構建過程(隨機連接)。起初,留下來的學生只是幸運而已。但是,通過組合足夠多的幸運機器人,只保留那些有用的,然後隨機地組合出新的副本,最終一個學生機器人出現了,它不是靠運氣,而且可能幾乎不能區分蜜蜂和數字3。這一點被複製,並被應用到所有其他機器人。

慢慢地,平均測試分數上升,下一輪生存所需的分數也越來越高——從50%到60%,70%,80%,90%,95%,等等。

當我們繼續這個循環,最終,從無限大的校舍裡,一個可以分辨出照片中的一隻蜜蜂和數字3的學生機器人會出現,準確率高達99.999%。這個數字意味著在假設的1000000張照片集合中,只有1張照片出錯!

但是學生機器人是如何做到這一點的,無論是教師機器人,建造機器人,甚至是人類的監督者都無法理解,學生機器人本身也是如此。在保留了這麼多有用的隨機變化之後,它的線路和晶片就變得極其複雜。雖然一行代碼不難理解,可代碼簇就難了。就是因為這樣,機器人的代碼整體很難被我們理解。

這是可的,但也同時令人沮喪,特別是學生機器人只擅長已經被教過的問題。如果照片是倒置的,或者照片不是蜜蜂,比如貓,它就會覺得很困惑。我們的機器人老師不能教所有的東西,所有的人類監工能做的是給它更多的問題,使測試更長,連最好的機器人會出的錯也要訓練到。

理解這一點很重要,這也是公司非常喜歡收集數據的一個原因——更多的數據等於更多的測試,等於更好的機器人。當你在網站上做「你是人類嗎」的測試時,你不僅證明了你是人類,而且也在幫助建立這個測試,讓機器人能夠讀、數、分辨山巒上的交通燈、馬和人。

在網際網路上的任何地方,後臺都有一些測試來增加用戶的互動,或者設定合適的價格來使得收益最大化,或者從你所有的朋友那裡「偷錢」。你喜歡朋友分享的文章,這是讓機器人根據你的聯繫人了解你喜歡什麼的一種方式。如果它是可測試的,那麼它就是可被教的!

至少在一段時間內,教師和學生機器人將從數據備選庫中畢業,正式成為領域中的算法。我們習慣了這樣的想法:我們使用的工具,即使自己不懂但總有人懂,但隨著機器學習發展,我們越來越處在一個人類使用工具或被工具使用的位置,沒有人、甚至它們的創造者也不懂。我們只能希望可以用測試來指導工具,並且用起來順手。

識別蜜蜂和3隻是一個簡單的例子。現實世界的一些應用包括:早期發現癌症,我們訓練機器人理解各種癌症發展和分類模式,辨別惡性癌症(嚴重、緊急醫療)或良性(稍不嚴重、最小的醫療保健);解決航空公司座位價格;提前數月預測危險的龍捲風;還有自動除顫器的應用等等。

自動除顫器

雖然對人類來說一些算法已成黑箱,但也不用擔心機器人會佔領世界。正如機器學習專家Andrew Ng所說:「擔心機器人接管世界就像擔心火星上的人口過剩一樣。我們還沒到那時候呢!」

留言點讚關注

我們一起分享AI學習與發展的乾貨

如轉載,請後臺留言,遵守轉載規範

相關焦點

  • 數學老師坦言:掌握了這100道方程式解應用題,網課就算是沒白聽
    數學老師坦言:掌握了這100道方程式解應用題,網課就算是沒白聽小學生年齡較小,所以教師在教學時要注意到小學生這個年齡段的心理特點,聯繫生活實際,選擇學生比較喜歡的內容進行教學,創設積極地教學情境,這樣可以使學生對課堂更感興趣
  • 題拍拍籤約100名清華北大解題官免費解題,搜題軟體如何有溫度?
    來源:藍鯨財經近期,好未來旗下中小學拍照搜題軟體題拍拍獨家籤約100名清華大學、北京大學學生擔任題拍拍解題官,為廣大中小學生供在線解題服務。題拍拍主打真人在線免費解題,力圖讓在線解題更有溫度。題拍拍倡導的「溫度」,又是如何實現的?20%的難題與100%的門檻實際上,一直以來,市場上對於拍照搜題存在剛需。市面上也並不缺少拍照搜題軟體。但眾多搜題軟體是否解決了學生解題需求,卻是存在諸多疑問。最突出的問題是,如果學生遇到題庫中沒有的題目,解題就會陷入「不會就是不會」的窘境。
  • 小學生做錯題,老師公開在群裡批評家長不負責,反遭家長霸氣回懟
    文/荔枝育兒日記學生的健康成長和老師有很多關係,任何細節都可能傷害到學生。現在學校的管理和以前出現了很大的不同,現在的管理更加傾向於老師和家長一起管理學生。老師會把所有的家長放在微信群裡,把當天布置的作業直接發在微信群裡面,讓家長可以清楚地了解到。這樣做的目的,讓家長能夠知道今天老師布置的作業是什麼,順便方便家長對孩子進行檢查,這樣不會存在學生放學了,不知道老師到底布置的什麼作業。
  • 合肥168中學高一學生迎來AI英語老師——訊飛掃描詞典筆
    你試過海底撈的機器人訂餐服務嗎?你知道虛擬主播是怎樣實現播報的嗎?你知道機器翻譯是如何做到又快又準的嗎?在學生和老師最關心的智慧教育領域,人工智慧、大數據技術怎樣幫助定位學習盲區?如何為學生提供個性化指導?智慧課堂是怎樣協助老師備課的?人工智慧技術怎樣協助老師組卷?主題交流中,這些問題被一一揭秘。兩款學習神器精彩亮相,A.I.助力自主高效學習A.I.
  • 一年級數學第八單元測試卷,學生計算題出錯多,老師分析原因
    一年級第八單元的學習的主要內容是20以內的加法,學到的方法就是湊十法,分別學習了9加幾,8加幾,7加幾和6加幾的進位加法,試卷中幾乎每道題都沒有離開過計算。在規定的時間內有部分學生根本就沒有完成試卷,結果就可想而知了。這些學生的家長紛紛私信我,覺得一年級才開始,自己的孩子就落後於人,有點焦慮,也有點不甘心。
  • 一年級下冊語文考試,學生考了99分,一個細節看出老師要求很嚴格
    一年級下冊語文考試,學習考了99分,一個細節看出老師要求很嚴格。本學期小學生們基本上都已經返校複課了,那就要認真學習了,說不定老師一開學就給學生考試,看這段時間線上教學學習效果怎麼樣。考察學生學習狀況最好的方法就是考試。
  • 教師篇:通過KET/PET閱讀如何激發學生學習潛能?
    為了幫助廣大教師、家長和考生加深對此次改版的理解,今天的文章專為廣大教育工作者量身打造,為您分析青少年英語學習者的學習動機,幫您了解如何利用2020新版A2 Key / B1 Preliminary考試的閱讀教學來激發學生的積極性,讓您更加科學高效地幫助學生學習英語和複習備考。如何激發11歲+青少年英語學習者的學習熱情?
  • 推薦算法系統/人臉識別/深度學習對話機器人高級實戰課
    比如大數據平臺工程師負責Hadoop集群和數據倉庫,ETL工程師負責對數據倉庫的數據進行處理和清洗,算法工程師負責核心算法,Web開發工程師負責推薦Web接口對接各個部門,比如網站前端、APP客戶端的接口調用等,後臺開發工程師負責推薦位管理、報表開發、推薦效果分析等,架構師負責整體系統的架構設計等。所以推薦系統是一個多角色協同配合才能完成的系統。
  • 答500題判斷學文學理 北京「潛能測試」引發爭議
    中新網北京2月18日消息:近日,北京部分中學開展回答500個問題就可幫助學生選擇學文還是學理的「體能測試」,引發了人們的爭議。  組織北京市第165中學測試的冷老師告訴北京青年報記者,該校共有11名學生參加「潛能測試」。測試從學生的興趣、生涯動機、能力、個性等幾個方面對學生進行考查,最後由專家寫出分析報告。
  • 一年級數學期末測試卷,學生成績不盡如人意,讀不懂題是主要原因
    今天下午進行了數學測試,晚上我帶回家閱卷。看後感覺很多學生的成績不盡如人意。於是我針對各個學生的答題情況,靜下心來分析造成成績低下的主要原因是什麼。首先考試的時候,我沒有給學生讀題。以前正式考試的時候,老師是給讀題的,最近幾年,考試不讀題,一年級的試卷大標題都印著拼音,但是裡面的小題並沒有拼音。所以我在平常做練習的時候,也都不給學生讀題,來培養學生的讀題能力。其實很多題,學生不是不會做,就是因為不認識字,不會讀題,理解不了題意,造成題做不上,或者做上來也是錯誤答案。
  • 給你上網課的老師,竟然可以是機器人?全球最強AI虛擬老師深度剖析
    截止目前為止,已有多個聊天機器人被判定成功通過了圖靈測試,而虛擬教師這個概念也早在幾十年前就已被提出。教育界早有共識,由經驗豐富的老師進行一對一個性化輔導是最佳的教育方式,然而這種方式受限於高成本和高人力,很難大規模推廣(如圖)。
  • 孩子考了100分,被老師說成「考試機器」,家長不要過分解讀
    孩子考了100分,老師說她是「考試機器」,女兒心裡不舒服,家長心裡也不爽,不過家長還是耐心地給女兒解釋了原因。 你首先得承認老師也是個活生生的人,而不是聖人。這樣的老師不裝、能開玩笑,是個有煙火氣的老師,我認為很好!孩子敏感也是分人的,如果老師一直是嚴厲的說出這麼一句孩子會多想,但是一個平時有煙火氣的老師說這麼一句相信你孩子也不會在意。 「考試機器」的字面意思是只會考試,排除這個老師是諷刺孩子,也可能表達能力差。也可能是老師的幽默感!
  • 數學老師整理:五年級數學100道經典解方程應用題,完整版可列印
    數學老師整理:五年級數學100道經典解方程應用題,完整版可列印很多五年級學生家長都在問我該如何輔導孩子進行數學學習,每次我的回答都高度相似,總結起來就是一句話:培養學生的數學興趣。作為影響學生學習效果的一個重要因素,關係到學生在課堂教學中的表現。在小學數學課堂教學中,教師應認識到學習興趣對學生的影響,引導學生正確理解和對待數學學科,在學習數學的過程中給予適當的指導和鼓勵,注重培養學生學習數學學科的自信心和積極性,努力提高課堂教學質量。數學是抽象而複雜的,小學生在實際學習過程中會遇到一些困難。
  • 科普貼|孩子如何接觸和學習機器人教育?
    孩子們在玩機器人的時候,其實是在嘗試把模仿學習模式轉化成試錯學習模式。以前在課堂上學生總是模仿學習,這種學習模式不能說不好,但卻不利於調動起他們學習的內在動力。試錯學習則給了他們一個很好的補充方式。這個時候,如果孩子還對機器人有著濃厚的求知慾望,可以挑戰高階的機器人--人工智慧的學習。這一階段的主要學習目標是學習高級編程語法、時間控制、PID控制、傳感器應用、機械原理與應用等。人工智慧的學習較有難度,從模型機器過渡到人形機器人,實際應用到指紋識別,人臉識別,視網膜識別,自動規劃,智能搜索,自動程序設計,智能控制,語言和圖像理解等等。
  • 一年級數學期末測試卷,看似簡單,幾道小題就叫學生拉開了檔次
    所以一年級的考試的時候,除了極少數的學生成績太低,絕大部分學生的成績都是比較理想的。但是如果一份試卷,全班都考了100分,那出題的人也就太顯示不出水平來。所以總會有那麼幾道題,是有些難度,但是它也沒有超出教材的標準,就是這幾道小題,就叫小學生們的分數拉開了檔次。
  • 小學數學:從9到1加減得100,家長怒斥出錯題,老師默默拿出課本
    班主任出面了,她對大家說,「這道題出自我們的數學課本第35頁,認為它是錯題,說明沒有認真看書預習;知道題意卻做不出來,說明孩子還需要家長數學思維的訓練。」臉紅的家長翻開課本,果然是書上的練習題,題意是可以用相鄰的數字組成兩位數,考察學生對100以內混合加減法的掌握情況。這道題應該怎樣解答呢?
  • 數學老師整理:五年級下冊數學100道列方程應用題,90%學生都丟分
    數學老師整理:五年級下冊數學100道列方程應用題,90%學生都丟分列方程解應用題是小學五年級階段的一個重難點,它不但要靈活運用方程式,更考查同學的思維邏輯能力以及理解能力,孩子稍不注意就會丟分,而且這也是孩子在五年級數學不能考滿分的一個原因
  • 喵喵機P2錯題整理神器,助力學生高效學習
    更重要的是熱敏印表機與手機APP相結合可以列印錯題,幫助學生更加省時省力高效學習提供了幫助,今天跟大家分享的是筆者最新入手的喵喵機二代P2錯題整理神器,並且與擁有海量題庫的作業幫合作,一起來看看究竟如何吧!喵喵機P2外包裝依舊沿襲了喵喵機簡約的設計,但是產品外包裝簡約而不簡單。不僅洋溢著時尚青春氣息,而且作為一款智能產品科技感十足。
  • 老師有一個共同點,他們只要說這些話,學生就會發出一陣唏噓聲
    有些謊言是善意的,老師利用謊言可以維護班級紀律,也可以激發學生的學習興趣,為學生學習提供精神能量。當然有一些話估計每個學生都聽過,那我們盤點一下那些年老師說的善意謊言。你們是我帶過的班級裡最差的一個不知道大家有沒有發現,每當班裡吵鬧聲音超過讀書聲時,老師就會立刻出現在班裡,時間把握的很準,感覺老師一直在身邊一樣。
  • 懂學生的老師是好老師
    對於任何一位老師而言,學生不懂不會可以教,不知道學生懂沒懂就很煩惱,以為學生懂了其實他們沒懂更惱火。最怕課堂上覺得同學們都聽懂了,結果考試成績一塌糊塗。導致很多老師明明很有抱負,想要提高學生的成績,卻常常感到有心無力。