編者按:今年夏天,OpenAI推出了一個新的計算機系統,這個新系統名為 GPT-3。在自然語言處理方面,GPT-3展示出驚人的能力,它能寫文章,做翻譯,還能生成代碼,甚至可以學習一個人的語言模式,並遵循這個模式與人進行談話。但是,GPT-3也有一定的缺陷,未來還需逐步完善。本文是下篇,上篇主要介紹了GPT-3的功能和特性,下篇將介紹GPT-3的缺陷及未來發展方向。本文譯自New York Times,作者Cade Metz,原標題為" My Name Is GPT-3 and I Approved This Article",希望對您有所啟發。
今年夏天,舊金山一家名為OpenAI的人工智慧實驗室公布了一項醞釀數月的技術,即名為GPT-3的新系統。這個系統通過分析數千本電子書、維基百科(Wikipedia)中的文字,以及貼在博客、社交媒體和網際網路上的近1萬億單詞,來學習自然語言的細節之處。
GPT-3無人察覺的缺陷在20世紀60年代中期,麻省理工學院(Massachusetts Institute of Technology)的研究員約瑟夫·魏森鮑姆(Joseph Weizenbaum)建造了一種他稱之為ELIZA的自動化心理治療師。從2020年的角度來看,這個聊天機器人非常簡單。
與GPT-3不同,ELIZA並沒有從散文中學習。它是根據設計者定義的一些基本規則運行的。它基本上是在重複你對它說的話,只是以問句的形式。但更讓魏森鮑姆吃驚的是,許多人把機器人當作人類一樣對待,毫無保留地提出他們的問題,並從機器的回應中獲得了安慰。
當狗和其他動物表現出一點點類似人類的行為時,我們傾向於認為它們在模仿我們,而不是它們真正的行為。機器也是如此,科林·艾倫(Colin Allen)是匹茲堡大學(University of Pittsburgh)研究動物和機器的認知技能的教授,他說:「人們被吸進去了,」他說,「即使他們知道自己被吸進去了。」
這就是GPT-3的一部分。因為它可以生成令人信服的推文、博客文章和計算機代碼,因此我們把人性解讀到這個數字系統中,而不那麼關注它的局限性。
實際上在實踐中,系統失敗的次數和成功的次數差不多。我們忽略了它編寫的計算機代碼需要人類程式設計師進行一些微調——這裡刪除一行,那裡添加一行。我們沒有注意到,在幾次交流之後,它的對話天賦就會失效,因為它無法 「記住」 幾秒前說的話。我們也沒有完全意識到,雖然這個系統為利亞姆·波爾(Liam Porr)生成了一篇令人信服的博客文章,但是是波爾擬定的標題、配圖和前幾句話,並刪除了一些不太令人信服的句子。
波爾認為,GPT-3在短期內不會對打擊虛假信息的戰鬥造成巨大威脅,因為它仍然需要人類的大量幫助。像這樣的工具只有在完全靠它自己能夠產生大量令人信服的虛假信息的情況下,才會變得真正危險,而這些虛假信息的數量遠遠超過當今僱傭一個團隊能夠完成的數量。
同樣,當應用程式設計師問 Singer 關於GPT-3是否對其職業生涯構成威脅時,他向他們保證,至少現在還沒有。他認為這是讓他們的工作更輕鬆的一種方式。他說:「如果GPT-3能實現70%的目標,那就意味著省去了許多繁瑣的工作。」
我們不知道的是,在未來的幾個月和幾年裡,這項技術將會有多少改進。
更智能、更快,也更貴當OpenAI的研究人員用發布在網際網路上的超過1萬億字對GPT-3進行訓練時,他們進行了第二個實驗,用數萬張數碼照片對一個類似的系統進行訓練。該系統可以分析所有這些照片,並學習如何構建圖像,就像GPT-3構建段落一樣。給定一張貓的照片的一半,它可以生成貓的其餘部分。
一些研究人員認為,這個實驗表明,這樣的系統最終可以像人類一樣,同時處理語言、視覺、聲音等跨越多個維度的任務。他們說,即使只訓練語言,這個系統也已經可以進入其他領域,無論是計算機編程、下棋還是製作吉他標籤。
但是,繼續改進這項技術並不是一件小事。處理所有這些網際網路數據需要一臺專門的超級計算機連續運行數月,這是一項極其昂貴的任務。當被問及這樣一個項目是否耗資數百萬美元時,OpenAI的執行長薩姆·奧特曼(Sam Altman)表示,成本實際上「更高」,可能會達到數千萬美元。
OpenAI負責研究的副總裁Amodei說,這項技術仍有改進的空間,需要使用更強大的處理能力來分析更多的數據。但他也表示,這種方法的「動力」可能即將耗盡。
但至少,GPT-3對於人工智慧研究人員和企業家來說是一種新工具,一種構建各種新技術和新產品的方式。電腦程式員瑞格利(Wrigley)最近辭去了他的日常工作,創辦了一家名為LearnFromAnyone的公司,旨在利用GPT-3 構建一種自動化導師,它可以偽裝成從科學家道格拉斯·霍夫斯塔德(Douglas Hofstadter)到風險投資家彼得·蒂爾(Peter Thiel)等所有人的樣子。還有一些初創公司則致力於為電腦程式員自動生成代碼,為營銷專業人士自動編寫促銷郵件和推特等。
但目前還不清楚這些服務最終的效果如何。如果GPT-3隻有一半的時間能生成正確的文本,它能滿足專業人士嗎?目前還不清楚這項技術能否成為真正的對話機器,更不用說真正的智能系統了。Amodei說,在通往能夠模仿人類大腦的漫長道路上,如果想要取得更多進展,需要全新的想法。「這有點像化學反應,」他說,「我們有一種原料,但還需要其他成分。」
譯者:Jane