宇宙萬物只是4萬億個參數?AI大佬為此「掐」了起來-虎嗅網

2021-01-22 虎嗅APP



生命、宇宙和萬物的奧秘究竟是什麼?


數學家說是來自於根號、方程式和複雜的函數;天體物理學家說來自量子糾纏、原子核裂變、白矮星坍縮;生物學家說來自DNA、RNA......


而AI大佬卻說,是來自4.398萬億個參數而已。


除非你一直在火星上度假,否則你肯定注意到了GPT-3。


AI大佬們談GPT-3:生命、宇宙和萬物的答案,就只是 4.398 萬億個參數而已


在GPT-3論文發表不久,神經網絡之父Geoffrey Hinton對最近媒體追捧的有1750億個參數的語言訓練模型GPT-3 的評價:「鑑於 GPT-3 在未來的驚人前景,可以得出結論,生命、宇宙和萬物的答案,就只是 4.398 萬億個參數而已」。

       

      

但是著名的人工智慧研究者Gary Marcus,發表最新見解,認為GPT-3壓根不了解它所談論的世界,you know nothing, GPT-3......

       

       

進一步增加語料庫只能讓它產生那些看起來更可信的七拼八湊的話語,但無法彌補其對世界根本性理解的缺失。將來出了GPT-4,也還是會需要人工幹預和篩選。


言外之意,儘管增加了這麼多的參數,也只是表面上看「懂」得多了許多,但這種「懂」是沒有靈魂和內核的,並沒有從本質上破解人類世界的奧秘。


起因是其中一個讀者提到,cherry-picking是一個巨大的問題,cherry-picking指的是人為的精挑細選,比如通順有趣的句子。


「大部分GPT-3的樣例都是人工篩選的」。目前的結果只是把光鮮亮麗的cherry呈現在了眼前,還有一大堆成千上萬的bad case怎麼不說。


cherry-picking的問題其實早已有之。


去年年底,《經濟學人》雜誌發表了對 OpenAI 的 GPT-2 文本生成系統的採訪,當時故意說 GPT-2 給出的這些回答「未經編輯」,而實際上,每個回答都是從生成的 5 個候選回答中由人類挑選的,挑選標準是要語意連貫而且幽默。看了這篇報導,原本以為AI已經能和人類自如對話了,但其實只是一場作秀。

        

       

當然Gary Marcus這麼認為不無道理。


他一直以來對深度學習領域的學術和應用成果持懷疑態度,這麼「潑冷水」也不是一次兩次了,為此也經常和其他大佬撕。


Marcus在此前的電話採訪中表示,我認為需要以一種哲學家們樂於接受的方式,以及經典人工智慧領域的人們有時會採用的方式,對世界進行非常仔細的分析,但不是只知道用正確的工具。」


他還曾經批判,「現在人工智慧,人們就知道一味地追求更多的數據和更快的機器。」


也有讀者進行了諷刺地回復,20年後的新聞:深度學習能夠治療癌症。


Gary Marcus:這個算法根本不能理解蛋白質的反應性......


都能治療癌症了,還要啥自行車?

  


GPT-3在進化:可生成高級論點,寫熱搜文章,還能構建AI模型


不論兩位大佬孰是孰非,隨著GPT-3的不斷進化,GPT-3會不斷產生新的應用是不爭的事實。


當GPT-3達到人類數量的神經元後,會變的和人一樣聰明嗎?



像所有的深度學習系統一樣,GPT-3在數據中尋找模式,然後在神經元中更新權重。


為了簡化這事,GPT-3已經訓練了一個巨大的文本語料庫,從海量文本中挖掘統計規律。這些規律對人類來說是未知的,它們以向量的形式被存儲為 GPT-3神經網絡中不同節點之間的數十億個權重連接中。


GPT-3革命性的一點在於,這個過程不需要人工幹預, 程序在沒有任何先驗指導的情況下就能自動查找和發現模式,然後用這些模式來完成文本生成。


如果你在 GPT-3中輸入單詞「fire」,它會推測到單詞「 truck」和「 alarm」比「 lucid」或「 elvish」出現的概率更大,一切都很簡單。


吞噬了巨大的文本之後,GPT-3的知識深度和複雜性都遠超常人。


可生成高級論點,能自我反省


哥倫比亞大學的認知神經科學家拉斐爾 · 米利埃做了一個實驗,他把一篇關於GPT-3的論文輸入給 GPT-3並要它對論文做出回應。

        

       

有趣的是,生成的文本不僅有高級的論點,甚至還有自我反省: 「人類哲學家經常犯這樣的錯誤,即假設所有的智能行為都是一種推理形式。這是一個很容易犯的錯誤,因為推理確實是大多數智能行為的核心。然而,智能行為也可以通過其他機制產生。我缺乏長期記憶力。每次我們的談話重新開始,我就會忘記以前發生的一切」。

       

       

確實有很多人質疑GPT-3的寫作能力,但是伯克利大學的Liam Porr用事實證明,GPT-3是有實用價值的。

牛刀小試,首發就上熱搜


你寫的文章上過熱搜嗎?他用GPT-3生成的第一篇文章,就登上了當天hackernews的熱榜!

       

      

他會給文章寫標題和介紹,添加照片,其他的內容由 GPT-3來完成。這篇博客現在有超過26000的訪問量,獲得了大約60個忠實粉絲,真的是漲粉利器!


自動構建圖片分類模型,生成Keras代碼


寫寫前端代碼,並不能充分展現GPT-3的代碼能力,現在有網友做出了一個可以直接生成Keras模型的應用,你告訴GPT-3想要一個圖片分類模型,圖片的格式,Keras模型就自動生成了。

       

       

儘管 GPT-3可以編寫代碼,但是很難判斷它的整體實用性。代碼是不是很亂?代碼是否會給人類開發人員帶來更多的問題?沒有詳細的測試很難說,也許一些bad case被刻意隱藏了。


但是大框架基本是沒問題的,即便加上人工的修改時間,GPT-3作為一個輔助工具,也極大地提高了工程師的生產力。


有微博網友表示,GPT-3這樣的大模型會讓很多人失業。

       

    

 對人工智慧行業來說,算法工程師不會受到大的衝擊,但是「調參俠」們可要上點心了。通用的人工智慧還有很久,但特定領域通用的代碼實現起來就沒那麼難了。


GPT-n的終極模式:通用人工智慧?


通用人工智慧是 AI 研究的究極目標。這個目標何時能實現?此前在一次對全球23位頂尖AI學者的一次調查中,最樂觀的人給出的時間為2029年,最悲觀的人認為要到2200年。平均來看,這個時間點為2099年。AGI是真正的有生之年系列。

       

       

其實Hinton和Marcus兩位大佬的分歧焦點最終要落在: 我們能否用現有的GPT-3來構建 AGI,或者我們需要在哪些基礎性研究中取得突破?


對於這個問題,人工智慧從業者們沒有一致的答案。


一方面,GPT-3缺少創造人工智慧的關鍵組成部分,計算機在接近人類智能水平之前,需要理解諸如因果之類的東西。


另一方面,通過簡單地向GPT-3扔更多的數據和算力,這些模型確實會帶來更大的性能提升。


計算機科學家Rich Sutton在一篇名為《苦澀的教訓》的文章中提出了一種觀點,他指出,當研究人員試圖基於人類知識和特定規則創建人工智慧時,往往會失敗。


       

GPT-3代表著人類向 AGI 邁出了一小步,但這一小步並非微不足道,因為這個模型是非監督學習的。


它吃進無限的原始數據 ,而且每次都會有進步,它的知識是人類知識的總和,可以用你最喜歡的方式跟你交流,接下來,它會不會建立一個「世界模型」,變的無所不知?


未來還會有GPT-4,GPT-5,GPT-n值得期待。


                      

相關焦點

  • 圖靈獎得主Hinton:生命、宇宙和萬物只是4.398 萬億個參數
    【新智元導讀】生命、宇宙和萬物的奧秘究竟是什麼,是4.398 萬億個參數?GPT-3的究極進化就是AGI嗎?AI大佬們為此還產生了分歧。生命、宇宙和萬物的奧秘究竟是什麼?而AI大佬卻說,是來自4.398 萬億個參數而已。除非你一直在火星上度假,否則你肯定注意到了 GPT-3。
  • 圖靈獎得主Hinton:生命、宇宙和萬物只是4.398 萬億個參數
    ,是4.398 萬億個參數?AI大佬們為此還產生了分歧。 生命、宇宙和萬物的奧秘究竟是什麼? 數學家說是來自於根號、方程式和複雜的函數;天體物理學家說來自量子糾纏、原子核裂變、白矮星坍縮;生物學家說來自DNA、RNA.....
  • 對,多元宇宙只是他身上的碎片!
    熟悉漫威終極宇宙一些漫畫的粉絲,可能都會對「第一蒼穹」這個名詞聽起來相當拽的神明不陌生,而且,在整個漫威1610終極宇宙中,「第一蒼穹」的存在還是相當特殊的。至於有多特殊?只能說:漫威整個終極宇宙中的多元宇宙在不斷衍生的一開始,其實只是「第一蒼穹」身上的幾個碎片而已!那麼,究竟在漫威的設定中,這樣一位在定位上堪稱是漫威終極宇宙的「祖宗輩」的存在,在漫威終極宇宙中究竟實力有多強?又有哪些比較特殊的劇情設定呢?
  • 我的世界:和Minecraft真正的大佬比起來,我們還只是個「渣渣」
    最近瀏覽資料的時候,看到阜星大神建造的地圖,將視頻從頭到尾瀏覽一遍後,演說家發現和Minecraft中真正的大佬比起來,我們還只是個「渣渣」。這位大神玩家規劃的建築和玩法,給人一種很強的視覺衝擊感。Minecraft中真正的大佬看過Minecraft中那麼多的建築和玩法,演說家還是第一次被驚豔到,這位名為「阜星」的大神花費了2年的時間,通過一人之手建造出了一個光怪離奇的大陸。這個大陸中有著各種有趣的建築,都是圍繞著魔法時代來建造的,地圖中的細節也讓人嘖嘖稱奇,並沒有任何的敷衍感。
  • 萬物理論--上篇
    是不是聽起來有點像《道德經》裡所說的「道生一,一生二,二生三,三生萬物」。我們給定一個道(規則),就可以通過這個規則生成萬物。Wolfram認為,我們的物理學也是類似的,都是基於一個簡單的「道」。from=search&seid=8001470648386017939那麼再往大了想,有沒有可能,我們的宇宙,從宇宙大爆炸開始,也是基於一個簡單的規則,經歷一百多億年的無數次迭代,生成了我們看到的這個宇宙,生成了我們。舉個小點的例子,我們生活中看到的雪花大部分是這些樣子:
  • 萬物起源——宇宙大爆炸
    萬物起源,宇宙大爆炸,這個理論認為宇宙突然生成並且大小有限。直到20世紀中葉,大多數科學家還認為宇宙體積無限大,年齡無限長,直到愛因斯坦的相對論,讓我們對重力有了更好的理解。首先,宇宙大爆炸並不是一場爆炸,而是所有的空間同時向所有方向伸展,剛開始宇宙非常非常小,接著很快就變成一個足球場那麼大,宇宙並沒有膨脹成任何東西,宇宙只是膨脹成它自己。宇宙不能膨脹成任何東西,因為宇宙沒有邊界,從定義上說宇宙並沒有」外面」,宇宙就是所有的一切,在這個高溫且緻密的環境中,能量會變為只能存在一瞬間的粒子。
  • 「萬物理論」是什麼?這個宇宙的終極答案
    因為鞋底和地面之間的電磁相互作用在支撐著我們。還有兩種在亞原子尺度下起作用的力:強核力和弱核力。前者將質子和中子結合在一起成為原子核,後者則掌控著諸如輻射衰變這樣的過程。所謂萬物理論,就是要表明所有這4種力都是同一種力的不同偽裝而已。
  • 無中生有:從宇宙萬物到經濟危機
    道家認為,天下萬物生於有,有生於無。道教,發源於春秋戰國時期,距今已有兩千多年。在宇宙大爆炸的這一刻,宇宙無限小,密度無限大,時空曲率無限大。這個時候的宇宙,什麼都沒有。之後宇宙迅速膨脹,宇宙溫度開始下降,夸克出現組成質子,中子等基本粒子,質子和中子組成重氫,重氫聚變產生氦元素及其他元素。於是,宇宙萬物就這麼從虛無中誕生了。
  • 宇宙中有多少星系?最新數據是2萬億個
    據《天文學》雜誌報導,諾丁漢大學的天文學家進行了宇宙星係數量的最新調查,並且推斷之前的星系評估數量被低估了。
  • 宇宙有多重?相當於1000萬億億個太陽的質量!
    無論是地球,還是太陽,或者擁有上千億顆恆星的銀河系,都只是宇宙的一小部分。宇宙中包含不計其數的星系、星系際介質、各種輻射以及未知的暗物質和暗能量,那麼,這些東西(質能等價關係E=mc^2)加起來會有多重呢?或者說宇宙會有多重呢?
  • 宇宙中最大天體:質量是地球的2萬萬億倍,體積是太陽的2億億倍
    宇宙中最大天體:質量是地球的2萬萬億倍,體積是太陽的2億億倍太陽系內有著數不清的恆星和行星,太陽和地球僅僅只是其中最微不可聞的一顆天體而已
  • 4萬億攝氏度是什麼概念,你對溫度與熱的理解可能有偏差
    人類還有高科技設備,那就是相對論重離子加速器,2010年的時候,美國紐約長島的布魯柯黑文國家實驗室就利用這個設備創造出了4萬億度的高溫,為此科研人員將兩束金離子束各自加速到近光速後對撞,真的很不容易。不僅如此,在2012年的時候更是傳出了創造出5.5萬億攝氏度的高溫,這是迄今為止人類創造出來的極限高溫。
  • 宇宙在膨脹,人們是怎麼發現的?-虎嗅網
    弗裡德曼的模型只取決於三個參數:圖3 (上)宇宙學原理假設下,不同的物質密度決定了不同的時空幾何;(下)不同密度參數下宇宙的相對尺度隨時間的動態演化(膨脹或收縮)[4]弗裡德曼關於宇宙的模型很多,但正確的只有一個,能夠反映現實的那個。愛因斯坦認為自己是正確的,他寫了一封投訴信到弗裡德曼發表文章的期刊,質疑弗裡德曼的工作,並認為他的結論「很難有什麼物理意義」。被愛因斯坦這樣世界上最優秀的物理學界大佬質疑,讓弗裡德曼的聲譽瞬間跌入了深淵,雖然弗裡德曼仍然堅持自己的想法,但他沒有敵過多舛的命運。
  • 萬物皆數,畢達哥拉斯的宇宙法則
    在公元前550年左右,作為古希臘的唯一哲學門派,愛奧尼亞(Ionia)的米利都學派(Miletus)已經如火如荼地發展起來。米利都學派創始人泰勒斯一天到晚念叨著:「萬物起源於水」「水是最好的」。誰知他的弟子阿那克西曼德馬上站出來否定:「水太實際了,萬物起源於具有無限屬性的阿派朗」。話音未落,他的第二個弟子阿那克西美尼又慷慨陳詞:「你們都錯了,萬物起源於氣」。
  • 11個維度詳細圖解 一起來了解宇宙的秘密
    了解了上面的東西,還是遵循規矩,把七維空間與引起宇宙大爆炸的因素(像三維立體空間+某刻時間形成四維空間那樣),加起來是第八維度,第八維度可以理解為宇宙大爆炸,因素改變會產生了無數個平行宇宙,七維度空間是我們現世宇宙的所有可能性集合,而在八維空間中每個平行宇宙的所有可能性集合都是不同的點。
  • 宇宙中存在10萬億度的高溫?如果存在,它是用什麼材料製造的?
    宇宙中存在10萬億度的高溫?如果存在,它是用什麼材料製造的?世間萬物都是有溫度的,無論運動還是不運動的物體,都能測量出它們的溫度。我們都知道,人的正常體溫維持在37攝氏度,如果高於這個體溫,就證明發燒了,人死後身體會漸漸變涼,體溫下降。
  • 陳藝通創建萬物軟體學,人類從此能夠全面完整地認識宇宙萬物了
    因為在此之前人類認識理解學習宇宙萬物只有硬體的概念,沒有廣義軟體的概念,即對宇宙萬物只認識理解到硬體層面部分,還沒有認知理解清楚明白到其內含的內在的軟體層面部分,所以沒有認識認知理解明白宇宙萬物的全部,所以造成對宇宙萬物的認識認知和理解是缺少了最重要與最內在的軟體部分。
  • 宇宙萬物的等級劃分
    宇宙萬物的等級是有區分的。如圖1所示。隨著宇宙的演化或者萬物的發展,最終會接近於這個無所不能的能量階段,越接近這個狀態,萬物的級別越高,能力越強。陰陽太極在一生二,二生三,三生萬物的進一步演化中,形成了宇宙的混沌狀態,並且不斷在擴張,也就是形成了混沌大神。後續繼續演化形成了盤古、女媧,星雲,星球,風雨雷電等大神,這就是神階段。隨著宇宙能力的減少,已經沒有多餘的能量形成更多的神,神階段的演化就停止了。後來神需要幫手來管理宇宙,就用自己的部分靈氣或者身體創造了各類半神,就是半神階段。
  • 2萬億,科學家確定宇宙中星係數量,卻發現另一絕望真相!
    當然了,想要知道宇宙中究竟有多少恆星,首先要知道宇宙究竟有多大。在探索宇宙的懵懂時期,人們以為銀河系就是整個宇宙,星河中那些模糊的光點只是在空間中四處飄蕩的雲團塵埃。 嚴格說起來,哈勃觀察的這片區域僅僅是整個天空的2400萬分之一,相當於一個人看100米之外的一個高爾夫球。然而,這2400萬分之一區域的觀察結果卻讓所有人都驚呆了,因為它其中竟然隱藏著近4000多個星系。
  • 掌控最深層次的真相,萬物之理可以解釋宇宙中所有的謎團
    目前這個問題的答案是三個字:不知道。萬物之理,以最簡潔最基本的方式描述宇宙中的萬事萬物,這就意味著只要宇宙有最小距離存在,萬物之理就能在這個最小尺度上成立,它必須把宇宙中最小的體積也納入它的管轄範圍,它還必須以一種最統一的方式描述所有零件之間所有可能產生的相互作用,也就是——「力」。