Facebook AI 創造人類不理解的語言?它們只是沒學好英語

2020-12-12 極客公園

作者:

我想你們大概都知道 Facebook 一個 AI 項目失控被迫關閉的事了。據外媒報導,Facebook 於 6 月開始測試的 AI 系統出現了問題,兩個智能對話機器人在對話時開發出了「人類不理解的語言」,目前這個項目已經被 Facebook 自己關閉了,其官方解釋說研究人員「希望 AI 與人溝通,而不是相互溝通。」

但是 Facebook 關閉該項目的新聞已經曝出半個多月了,而其 AI 聊天機器人「創造一種人類無法理解的語言」這事更是六月的舊聞了。為什麼這件事現在又火起來了呢?

原因可能是 Facebook 的創始人馬克·扎克伯格剛剛與埃隆·馬斯克就 AI 威脅論的問題隔空吵了個架,餘熱尚在,Facebook 被迫關閉「失控」的 AI 項目絕對是一波「打臉」的好戲碼,於是我們就看到一波鼓吹 AI 威脅論的聲音此起彼伏。

(有關該事件的外媒報導)

但我們在看了許多外媒文章之後發現,他們並沒有對此事追根溯源,從一開始,他們就把 AI 之間語法不通的英語句子看做了一種全新的語言,而 Facebook 的兩個聊天機器人 Bob 和 Alice 使用的依然是英語單詞,只是語法上沒有任何意義而已。

Bob:「I can can I I everything else."

Alice:「Balls have zero to me to me to me to me to me to me to me to me to."

翻譯過來是:

Bob:「我能能我我所有其他事。」

Alice:「球沒有對我對我對我對我對我對我對我對我對。」

這怎麼看都是英語沒學好啊。

(Bob 和 Alice 的對話截圖;圖源:)Fast Co.Design

對於這件事,人工智慧公司 iPIN 的創始人楊洋表示,其實這種機器亂語的情況早就有了先例,Google 的聊天機器人就出現過這種狀況,「說是新的語言太勉強,反而是將文字符號化,高階語言降為低階語言,或者說機器語言。」

「自創語言」的來龍去脈

6 月的時候,Facebook 人工智慧實驗室發表了一篇文章,介紹了他們如何教 AI 與人類進行談判,他們希望訓練機器人不僅僅是在表面上模仿人類,而是真正的像人類一樣處理事情。

在這個項目上 Facebook 取得了一定的研究成果,他們的機器人在與人進行談判時,人類甚至無法區分出對面的是機器還是人類。

但後來情況發生了變化。

Bob 和 Alice 之間的對話出現了上述那種語法不通的句子,據 Facebook 人工智慧實驗室的研究人員 Dhruv Batra 所說,對話系統出現故障的原因是因為「沒有針對英語語言的獎勵機制」。此前我們報導過,深度學習技術的一個延伸——加強學習(Reinforcement Learning)中,技術人員可以通過設立獎勵機制來規範機器自學習的方向,從而得到開發者更想要的深度學習結果,比如去年 AlphaGo 在升級的過程中就使用了這樣的技術,再比如在這個事件裡,據 Dhruv 的說法,如果研究人員在系統中編寫針對英語語法的獎勵機制,系統就會偏向於更符合英語語法的語言,也就不會出現現在的情況。

我們就此事採訪了 AI 平臺公司三角獸科技的創始人馬宇馳先生,他認為「這應該是一個小題大做的事情,在模型訓練不完善的時候對話,會有類似的情形,理解成沒完成的訓練工作也許更合適。

另外一邊 iPIN 的創始人楊洋也持有類似的觀點:「任何對話,加上 GAN(生成對抗網絡),再做一些語言價值預設作為反饋邏輯,很容易出現這種情況。其實用 GAN 來訓練機器人編程,本來就是這麼個思路。」

說到底,這就是個技術失誤,所謂「英語是一個非常複雜且難懂的語言,對機器學習來說不是很適合」,聽起來非常危言聳聽,好像 AI 像科幻電影裡一樣,已經開始「淘汰人類」了,但事實是,機器只是機器,他們不過是設定好的程序,你見過哪個程式設計師用英語寫程序的?

這一點是各類鼓吹 AI 真的發明了一種語言這種說辭的的文章沒有提到的。

項目關閉原因有待證實

談到 Facebook 關閉該項目的原因,馬宇馳先生的態度非常明確:「Facebook 關閉 AI 項目的原因不可能是這種,應該是外面杜撰出來的」,報導中出現的問題「修復重置等等都可以(解決)」。

據外媒最初的報導,Facebook 的研究員 Mike Lewis 表示,他們關閉該項目的原因是因為目前的情況不符合他們的預期,「我們的目標是讓機器人和人聊天」。

原文裡並沒有給出詳細的採訪過程,也沒有被訪研究員的前後語境,加上文章從一開始就把它當做是 AI 覺醒奇點前兆一樣的事件來看待,確實給人一種科幻成真的感覺,但這其實是有點誤導讀者的意思了,馬宇馳先生也對文章中的採訪內容表示了質疑。

宣傳以外,是人主觀放大了問題

事實上,在人工智慧屢屢成為熱門事件的今天,人們在面對相關事件時其實夾雜著一點「對科幻的嚮往」,無論是《終結者》裡的「天網」還是《生化危機》裡的「紅皇后」,這些科幻故事中的機器反派往往叫人又愛又恨,在聽故事之後,人們往往有一種科幻成真的幻想情節,如果現實中出現了天網會怎樣?這也應該是科幻片最迷人的地方之一吧。

(《生化危機》中的紅皇后;圖源:)YouTube

此前美國的警衛機器人 Steve 故障「投池」就引起了好一波關注,先是在社交媒體走紅,有引起了各大媒體的報導,機器人自殺的笑話瞬間登上新聞頭條成為了熱門話題。有人認為 Steve 工作太無聊了自殺,有人認為巡邏散步的 Steve 思考人生時迷了路……不管怎麼說,都是典型的人的思維。

(警衛機器人 Steve 落水;圖源:)New York Post

但從官方的調查來看,Steve 落水的原因無非是下雨天氣影響或者障礙導致的緊急路線變更導致的,說到底都是尚待修復的 bug,不僅不是機器太過智能,反而是因為不夠智能導致的。

但外界對此的關心其實是有主觀選擇的,大眾對機器故障毫不在乎,但如果說是「工作無聊、投池自殺」就要吸睛得多。

而人們在對待類似的問題時,往往不由自主會去放大這樣的問題,微軟聊天機器人說髒話、機器人投池自殺、Facebook 聊天機器人發明語言……一個個事件累加起來給人一種 AI 越來越失控的感覺,但這種整體的感覺只是表層的感覺,沒有事實的依據,更沒有對每個問題進行深度的探索,加之馬斯克、霍金等大腕發聲宣揚 AI 威脅論,群眾不自覺地就會站在技術真相的對立面。

在一次內部培訓中,創新工場 AI 工程院副院長王詠剛先生就曾表示,在 Google 內部,技術人員甚至不願意將目前大行其道的深度學習技術稱為人工智慧。在他們看來目前家家戶戶熱議的人工智慧還非常初級,遠遠談不上智能。

人工智慧近幾年在商業上的發展是爆發性的,但在技術層面上,人工智慧還在按部就班地原速進步著,我們也沒有必要因為新聞裡故作玄虛的「人工故障」而驚慌失措。

對大多數人來說,我們都希望人工智慧取得突破性的發展來進一步解放人類的初級勞動,但對之寄予厚望的同時,我們也應該多了解一下人工智慧行業內真實的科技發展情況,沒有哪一項技術能在一夜之間取得全方面的突破,這一點是我們必須認清的。科技發展也許很快,但人的學習和適應能力更快,請相信,在「真·人工智慧」到來的那天,人類一定早已做好了準備。

頭圖來源:The Register

宋德

相關焦點

  • Facebook 自然語言處理新突破:新模型能力趕超人類 & 超難 NLP 新...
    簡而言之,這些新工具將幫助人類創建更強大的內容理解系統,而且能夠翻譯數百種語言,理解諸如含糊不清、共同引用和常識性推理等複雜的問題,從而減少現有的這些系統對大量標記訓練數據的依賴性。翻譯準確性的突破對於神經機器翻譯(NMT)模型,有監督式訓練通常需要大量附有參考翻譯的句子。
  • Facebook關閉「失控」 AI 項目:發展出人類無法理解的語言
    反應過來後,趕忙將他們兩個關掉了…最開始,研究者們覺得Bob和Alice說的沒啥意義,但是仔細一想,這..難道是…他們自己的語言?!這個對話好像改動了正常的英語,難道這樣會更便於他們的交流?如果仔細研究,會發現Alice說的 「對我(to me)」 其實是試驗項目中的回答模式。
  • 想真正的做好ai的話,你不能忽視語言本身的魅力
    不是沒有這個功能,而是沒有替代品,某諾亞方舟手機算嗎,某錘方舟手機算嗎,都是能搭載人工智慧ai的手機。老羅說小老闆搞「人工智慧」,就是搞不明白,做的是概念,小老闆啥都沒有,人工智慧?你們還是做輕薄款吧。siri自從存儲了基本語言包的android配合新系統1.0推送之後,很明顯是在為人工智慧ai的發展鋪路。siri已經可以接收輸入並且轉錄命令,與此同時該智能音箱也已開放試用。
  • Facebook 的 AI 意外地創造了自己的非人類語言
    Facebook 的研究人員在開發談判聊天機器人時,意外發現機器人自發地創造出了自己的非人類語言。
  • 【技術闢謠】Facebook機器人發明語言系誤讀,專家訪談還原真相
    然而,FASTCO 的報導寫道,「FAIR 的談判智能體利用強化學習和對話推演(dialog rollouts),表現與人類談判相當……這證明 FAIR 的 bot 不僅能講英語,並且對要講什麼也是有過思考的。」 更要命的是,文章引用了專業人士的評價——「智能體會脫離人類可以理解的語言,發明自己的代碼語言。」
  • 谷歌技術總監Ray Kurzweil:AI寫郵件只是語言理解第一步,未來它或...
    今年五月,谷歌向英語用戶推出了這項服務,上周,該項服務還推出了西班牙語。Smart Reply給出的回覆可能比較簡短,例如,「我們周一時做這件事吧」,「耶!太棒了!」「下周吧」。這些回復的內容雖然短小,但是確實是很實用的。而且,在消息發送前,我們還可以對這些自動生成的回覆進行再次編輯。Kurzweil表示:「這是人工智慧和人類智慧密切合作的一個很好的例子。」
  • 沒有語言環境,如何學好英語口語?
    在會上的交流互動環節,身邊的同學都不太敢說,而我沒有浪費這次機會,我坐到了外教的旁邊和他英語交流。那一場交流下來,感覺特別的爽,不僅有同學羨慕的眼光,老師們的刮目相看,更重要的是擺脫了」英語啞巴「,那個時候突然發現英語學了那麼多年竟然可以這樣」說出來「。高二那個時候英語口語不算好,只是會最基本的單詞發音,有一些單詞量。大學幾年的這種」訓練方法「,我受益頗多。
  • AI沒有偏見?它們從人類的語言中學會了性別和種族歧視
    他們從網上用爬蟲收集了220萬詞的英語文本,用來訓練一個機器學習系統。結果,系統也會展示出了與這些文本相同的偏見。在較為中性的例子中,人工智慧系統更有可能將「花朵」和「音樂」與「愉快」聯繫起來,而「昆蟲」或「武器」等不太愉快的詞不太可能建立這種聯繫。但人工智慧也也更有可能將歐洲裔美國人的名字與「快樂」聯繫起來,非洲裔美國人的概率較低。
  • 英語是人類的一種語言,不可怕!
    英語入門ABC逐漸會和家人、朋友用自己特定的家鄉語言進行交流。所以說,只要你會講話,語言都不是問題。現在要求學生從小就要學好語文,也就是從小就要學會說「普通話」,這也是作為一名合格教師的必備能力。沒有「普通話合格證」,當老師都沒有資格。隨著社會的發展,我們也要與國際接軌。「學外語」給我們帶來了更廣闊的世界。「學外語」真的那麼難嗎?其實不然!就「英語」來說,顧名思義,「英語」就是「英國的語言」。既然它是人類的一種語言,所以說,它不可怕!
  • Facebook否認AI失控:忘記設置英語語法
    研究員對兩個聊天機器人進行對話策略迭代升級,結果發現它們竟自行發展出了人類無法理解的獨特語言,科研人員不得不對其進行人工幹預。Facebook近日公開回應關閉AI失控語言事件,認為一些媒體的報導有失事實,造成不良影響。Facebook並沒有關閉機器人聊天系統,而是在使它們變得更加聰明可控。
  • AI自創語言聊天?其實真相是……
    從上圖可以看到,Bob和Alice之間的對話,仍然使用英語單詞,只是完全沒有遵守英語語序。也就是說,它們不是自創了語言,而是「太蠢」沒有學會好好地說英語。機器人確實按照程序設定進行,但在這個過程中,研究人員發現它們之間的交流並不全是英語,而是研發出了一種新的交流方式。像代數中用x代替數字一樣,它們開始用一些奇怪的字母組合代替原本的英語單詞。比如說,用「iii」代替「want」或者「orange」。這種語言的誕生並沒有那麼可怕。人類和人工智慧思維本來就是不同的。原本就不會說英語的兩個機器人只是找到了更快捷的「語言」。
  • Facebook開源多款AI工具,支持遊戲、翻譯
    阿司匹林出品 | AI科技大本營近日,Facebook 在年度開發者大會 F8 上宣布開源多款 AI 工具,除了 PyTorch、Caffe 等深度學習框架之外,此次開源的還包括 DensePose(可用於人體姿態估計)、Translate(可翻譯 48 種語言
  • AI 自創「非人類語言」互相交流,翻譯成「人話」竟然是這樣的
    What an AI's Non-Human Language Actually Looks Like最近,Facebook人工智慧研究實驗室發生了一件讓人意想不到的事情:訓練聊天機器人互相談判能力的研究人員實現了一件事情:讓機器人用一種非人類語言自由「尬聊」。為了跟蹤記錄機器人的對話,研究人員不得不調整設備模式,限定機器用人類可以理解的語言對話。
  • Facebook挑戰賽:利用AI檢測惡意圖文,還有很長的路要走
    作者發表博文《Hateful Memes Challenge and Data Set》(https://ai.facebook.com/hatefulmemes)概述了這項研究。另外幾個Facebook研究人員發表的另一篇博文《AI advances to better detect hate speech》(https://ai.facebook.com/blog/ai-advances-to-better-detect-hate-speech)廣泛地探討了AI檢測仇恨言論的話題。
  • OpenAI嘗試打破「中文房間悖論」,讓AI創造語言並自發交流
    雷鋒網了解到,如今越來越多的研究表示,如果用某種語言訓練計算機,實際上系統並不能深刻理解語言與真實世界的關係。OpenAI 發現了這一問題,並致力於讓智能體自己創造基於自身感知的語言。OpenAI 的研究基於這樣的一個假設:智能體對語言的理解,並不是在文本的龐大語料庫中提煉模式,而是通過學習單詞與環境之間的聯繫而實現的。因此,研究者們希望了解智能體們是否能自發產生一種內部溝通語言。訓練智能體創造語言研究者們將 AI 智能體放在一個簡單的環境中,並讓它們自由溝通。
  • 學不好英語只是因為中國獨立自主,學好英語的國家都被英美佔領過
    在這種環境下英語教師成了吃香的職業,只要能學好英語在中國就能成為人上人,而那些說著英語的外國人來中國天生就有著高級的職業外教,不管他在國外混得怎麼樣,只因為一口流利的英語就能在中國謀得一份高收入的英語外教工作。
  • Facebook的AI技術能理解表情包的內涵嗎?
    該自動化程序知道文本塊的位置,並能將它們與你應該籤名的地方區分開來。 一旦Rosetta知道文本在哪裡,Facebook就會使用一個神經網絡來轉錄文本並理解其含義。然後,它可以將文本傳輸到其它的系統,比如一個檢查表情包是否與已經被揭穿的病毒騙局有關的系統。
  • Facebook否認AI失控,機器人只是忘記了用「英文語法」?
    研究員對兩個聊天機器人進行對話策略迭代升級,結果發現它們竟自行發展出了人類無法理解的獨特語言,科研人員不得不對其進行人工幹預。Facebook近日公開回應關閉AI失控語言事件,認為一些媒體的報導有失事實,造成不良影響。Facebook並沒有關閉機器人聊天系統,而是在使它們變得更加聰明可控。
  • 不以英語為中心,百種語言互譯,FB開源首個單一多語言MT模型
    機器之心報導機器之心編輯部Facebook AI 近日開源了多語言機器翻譯模型 M2M-100,該模型不依賴以英語為中心的數據,可以實現 100 種語言之間的相互翻譯。機器翻譯(MT)打破了人類之間的語言障礙。
  • 人類的語言是如何產生的?
    史達林在他的語言學著作裡曾經說過:「任何低級的生物,都有自己的語言」。但近年來很多專家學者認為,人類之外的動物通過聲音的交流,或許和人類做的一樣好,但無論它們有多少層次的變化,都不是真正的語言。國外有專家曾成功地訓練人類的遠親---黑猩猩,教它們使用複雜的手勢和其它輔助方式交流信息,但無論如何訓練,它們自始至終也只能發出極少數單詞的音,由此推斷其它動物不可能產生真正的語言。人類語言能力的奧秘還有一個很重要的因素就是遺傳基因,兩歲的孩子能很自然地學會與別人交流,而無需刻意訓練,這就是人類所獨有的特質。