【通用人工智慧的新宇宙】OpenAI 重磅發布AGI測試訓練平臺Universe

2021-02-24 新智元

來源:openai.com

譯者:王楠、劉小芹、胡祥傑

新智元啟動新一輪大招聘:COO、執行總編、主編、高級編譯、主筆、運營總監、客戶經理、諮詢總監、行政助理等 9 大崗位全面開放。 

簡歷投遞:jobs@aiera.com.cn

HR 微信:13552313024

新智元為COO和執行總編提供最高超百萬的年薪激勵;為骨幹員工提供最完整的培訓體系、高於業界平均水平的工資和獎金。

加盟新智元,與人工智慧業界領袖攜手改變世界。

【新智元導讀】OpenAI 昨天發布 OpenAI Universe, 根據其官方博客的介紹,這是一個能在幾乎所有環境中衡量和訓練 AI 通用智能水平的開源平臺,當下的目標是讓 AI 智能體能像人一樣使用計算機。目前,Universe 已經有1000種訓練環境,由微軟、英偉達等公司參與建設。研究人員介紹說,Universe 從李飛飛等人創立的 ImageNet 上獲得啟發,希望把 ImageNet 在降低圖像識別錯誤率上的成功經驗引入到通用人工智慧的研究上來,取得實質進展。



繼今年 4 月發布 OpenAI Gym 之後,OpenAI 昨天又推出了新平臺—— Universe: 一個用於訓練解決通用問題 AI 的基礎架構。



根據官博介紹,Universe 是一個能在世界上所有的遊戲、網站和其他應用中,衡量和訓練 AI 通用智能的軟體平臺。

Universe 要讓 AI 智能體能像人一樣使用計算機:通過看顯示屏,操作虛擬鍵盤和滑鼠。我們必須全方位地訓練 AI 系統,解決我們想要它們解決的問題,而 Universe 則讓我們能夠訓練單一的智能體,執行任何人類能使用計算機來完成的任務。

今年 4 月,OpenAI 發布了 OpenAI Gym,後者是一套用於開發和比較強化學習算法的工具。有了 Universe,任何程序都能被接入(be turned into)到 OpenAI Gym 的環境中。Universe 通過在 VNC 遠程桌面後自動啟動程序來運作,不需要任何特殊的程序接口、原始碼或 bot API。

OpenAI 當前發布的版本含有 1000 個環境,包括 Flash 遊戲、瀏覽器任務(browser tasks),以及像 slither.io 和 GTA V 這樣的遊戲。還有更多這類環境可供訓練強化學習,幾乎所有都能在 Universe 運行,使用 universe Phython 庫運行



以上樣本代碼將讓你的 AI 開始玩 Flash 遊戲《Dusk Drive》。當然,你得安裝 Docker 和 universe才行。


我們的目標是開發單一的一個 AI 智能體,使其能夠靈活運用過去在 Universe 中的經驗,快速在陌生和困難的環境中取得掌控權,這也是通往通用智能的重要一步。

你可以以很多種方式參與 OpenAI Universe:授權 OpenAI 使用你的遊戲、在 Universe 不同任務中訓練智能體,以及接下來即將推出的整合新遊戲,以及讓智能體玩這些新的遊戲。



Universe 部分參與單位,完整列表見文末

人工智慧領域在過去幾年中取得了快速進展。計算機現在可以以前所未有的精度查看、聽取和翻譯語言。計算機也在學習生成圖像、聲音和文本。強化學習系統 AlphaGo 擊敗了人類世界圍棋冠軍。然而,儘管取得了所有這些進步,目前的 AI 系統仍然屬於「狹義AI」——可以在特定領域實現超人的表現,但缺乏在該領域外合理執行任務的能力。例如,AlphaGo可以輕鬆地在圍棋上擊敗你,但你不能期望讓它陪你一起玩其他遊戲。

具有一般問題解決能力的系統——類似於擁有人類常識,讓智能體能夠快速解決新的困難任務——目前仍然是不存在的。一個顯而易見的挑戰是,現在的智能體還不能將其經驗攜帶到新的任務中。在標準訓練制度下,智能體從零開始初始化,隨機抽取數千萬試驗中的一個,經過不斷試錯、學會重複行為,最終得到有益的結果。如果要向通用 AI 智能體取得進展,我們必須讓智能體經歷一系列不同的任務,以便它們能夠發展出關於世界的知識和解決問題的策略,以便在新任務中有效地重複使用這些東西。


Universe 通過一個通用的接口適用於各種場景:智能體通過捕捉屏幕的像素生成對鍵盤和滑鼠的命令來操作遠程桌面。場景需要 VNC 伺服器,universe 庫將智能體轉換為 VNC 客戶端。



Universe 的設計目標是支持單個的 Python 進程,以每秒60幀的速度並行驅動20個場景。每個屏幕的緩衝區是 1024×768,因此用外部進程直接讀取每一幀需要3GB/s的內存帶寬。我們用 Go 寫了一個面向批處理的VNC伺服器,它可以作為Python共享庫加載,並且逐步更新每個場景的一對緩衝區。在嘗試了許多 VNC 伺服器、編碼器和無證書協議選項的組合之後,現在的組合能以60幀/秒的速度驅動幾十個場景,延遲是100毫秒——這些延遲幾乎都是伺服器端編碼引起的。

以下是我們當前實現的一些重要特性:

通用性。智能體可以使用這個接口(最初是為人類設計的)與現有的任何電腦程式交互,而不需要仿真器或接入程序內部。例如,智能體可以玩任何一款計算機遊戲,與終端交互,瀏覽網頁,使用 CAD 軟體製圖,使用圖片編輯軟體或者編輯電子表格,等等。


熟悉性。由於人們已經非常熟悉這些像素/鍵盤/滑鼠的界面,人們可以輕鬆操作universe的任何場景。我們可以使用人類表現作為有意義的基準,只需簡單地保存 VNC 流量記錄跟蹤人類的演示。我們發現,在轉換到增強學習為給定的激勵函數進行優化前,這些演示在對使用行為克隆(即使用監督學習模擬人類行為)的合理策略的智能體進行初始化時非常有用。


以 VNC 作為標準。VNC 的許多實現都可以在線使用,而且包括 OSX 在內的一些實現已經默認封裝到常見的作業系統中。在 JavaScript 中甚至有允許用戶提供演示而無需安裝任何新軟體的 VNC 實現——這對 Amazon Mechanical Turk 之類的服務非常重要。


易於調試。我們可以在智能體正在訓練或評估時進行調試,只需將 VNC 客戶端附加到共享環境的 VNC 桌面。還可以保存 VNC 流量供以後分析。

我們都很驚訝 VNC 的作用如此強大。隨著我們的遊戲更大型,我們將開始使用額外的後端技術。但初步的跡象表明,現有的實現能夠更好:設置正確的話,用戶能夠以每秒20幀的速率在公共網際網路上運行 GTA V。



我們已經在Universe中加入了大量的運行環境,並且,我們認為這僅僅是一個開始。每一個環境都被打包成一個Docker圖像,包含了兩個伺服器,來與外部的環境進行溝通:VNC伺服器會向顯示器發出信號,並接收鍵盤或者滑鼠發出的指令;WebSocket 伺服器會發出強化學習任務所反饋的信號(以及所有的輔助信息,比如文本或者診斷),此外,還會接收控制信息(比如要運行的具體環境ID)。

Atari 遊戲

Universe 包含Arcade 學習環境中的2600種Atari遊戲。這些環境現在在quay.io/openai/universe.gym-core  的Docker 圖像上異步運行,並允許智能體在網絡之上進行連接,這意味著智能體必須要處理延時和低幀率。通過在雲上的局部網絡上運行,我們通常可以達到60幀每秒,觀察滯後20毫秒,行動滯後10毫秒。在整個公共的網際網路上,能降到20幀每秒,觀察滯後80毫秒,行動滯後30毫秒。


Flash 遊戲

在 Universe 的擴展上,我們把Flash 遊戲作為一個起始點,這些遊戲在網際網路上幾乎是無處不在dd ,總體上特徵比Atari 要豐富得多,但是個體上依然非常簡單。我們已經篩選了超過3萬個遊戲,並預計,還有一個數量級的遊戲沒有收錄。

最初發布的 Universe 包含了1000個Flash 遊戲(其中有100個有回饋函數),在獲得所有權持有者的同意之後,我們把它們發布在了 quay.io/openai/universe.flashgames Doker image上。此圖像開啟TigerVNC伺服器並啟動Python控制伺服器,該控制伺服器使用Selenium將所需遊戲的Chrome瀏覽器打開到容器內頁面,並自動點擊啟動遊戲所需的任何菜單。


 

提取回饋  

雖然沒有回饋函數的環境可用於無監督學習,或者用於生成類人的展示,但是,強化學習(RL)需要回饋函數。與Atari遊戲不同,我們不能簡單地從對內存的處理中讀取成功的標準,並且,關於每一個遊戲如何儲存這些信息,其中還有很多的變量。

幸運的是,許多遊戲都會有顯示在屏幕上的得分情況,這可以當成是一個回饋函數,只要我們能合理地解釋這些分數。雖然現成的OCR(例如Tesseract)在具有乾淨背景的標準字體上表現很好,但它在許多遊戲中常常遇到多樣字體,移動背景,動畫或遮擋物體等難題。

我們開發了一個基於卷積神經網絡的OCR模型,該模型在Docker容器的Python控制器中運行,解析得分(通過VNC自循環維護的屏幕緩衝區),並通過WebSocket通道將其傳遞給智能體。 我們的得分OCR模型發揮了作用。人類積分等級員提供了分數的上下界限。 OCR模型以每秒60幀的速度解析分數。

瀏覽器任務

在人類集體的努力下,現在網際網路已經被建設成一個關於信息的巨大寶藏,用於人類的視覺消費。Universe 包含了給予瀏覽的環境,這些環境要求AI 智能體能讀、導航,像人類一樣使用網站、顯示器、鍵盤和滑鼠。

目前,我們的智能體主要學習與常見的用戶交互元素(如按鈕,列表和滑塊)進行交互,但是將來他們可以完成更複雜的任務,例如在網際網路上查找他們不知道的事情,管理電子郵件或日曆,完成Khan Academy課程,或者完成亞馬遜 Mechanical Turk 和CrowdFlower 等任務。

Mini World of Bits  

我們首先計劃創建一個新的基準,能在一個簡單的設定下,捕捉瀏覽器交互中的一個的一個顯要難題。我們把這個基準稱為 Mini World of Bits. 

我們認為這可以跟MNIST類比,並且認為,能夠掌握這些環境為模型和訓練技術提供了有價值的信息,這些技術將在整個網站和更複雜的任務上有良好的表現。我們最初的Mini World of Bits 基準包括80個環境,從簡單(例如,點擊特定按鈕)到困難(例如,在模擬電子郵件客戶端中回復聯繫人)都有。


現實世界中的瀏覽任務。我們已經開始在更加具有現實意義的瀏覽任務上進行研究。智能體在獲得一份說明書後,開始在網頁上執行一系列任務。一個這樣的環境交給智能體一個具體的任務:預定航班。要求其操縱用戶界面以搜索航班。 (我們使用這些網站的緩存記錄,以避免發送垃圾郵件,或預訂大量真實的航班)。


未來的融合

這種基礎設施是通用的:我們可以集成任何可以在Docker容器(最方便)或Windows虛擬機(不太方便)中運行的遊戲,網站或應用程式。我們希望獲得整個研究社區的幫助,繼續延伸Universe環境的廣度,包括完成合作夥伴的遊戲、Android應用程式(模擬器可以在Docker內部運行)、fold.it、Unity遊戲、HTML5遊戲、在線教育遊戲等等,以及別人能想到的任何事。 微軟的Malmo團隊將與Universe集成,我們也期待著支持其他AI框架。



OpenAI 研究員還在文章中表示,研究進步要求對其水平進行有實際意義的衡量。在接下來的幾周內,他們將發布一個遷移學習基準,允許研究人員確定他們是否在機器的通用問題解決能力研究方面取得進展。  

Universe 從計算機視覺 ImageNet 數據集的發展中獲得靈感。李飛飛和她的合作者故意把 ImageNet 的基準設計為幾乎不可能做到的,但圖像識別的錯誤率從2010年的28%迅速下降到2016年的3%,達到(在某些情況下甚至超過)人類的水平。如果AI社區在Universe 上也一樣發展的話,那麼我們在研究普適性的、通用的人工智慧系統上,將會取得真正的進展。



負責人及鳴謝

Acquisition & partnerships: Erin Pettigrew, Jack Clark

Core infrastructure: Greg Brockman, Catherine Olsson, Alex Ray

Demonstrations: Tom Brown, Jeremy Schlatter, Marie La, Catherine Olsson

Distributed training infrastructure: Vicki Cheung, Greg Brockman, Jonas Schneider

Documentation & communications: Jack Clark, Andrej Karpathy, Catherine Olsson

Environment integrations: Alec Radford, Jonathan Gray, Tom Brown, Greg Brockman, Alex Ray, Catherine Olsson, Trevor Blackwell, Tambet Matiisen, Craig Quiter

Initial agent results: Rafal Jozefowicz, Dario Amodei, Ilya Sutskever, Jonathan Ho, Trevor Blackwell, Yaroslav Bulatov

Remote environment management: Vicki Cheung, Greg Brockman, Catherine Olsson, Jie Tang

RL baselines: Dario Amodei, Harri Edwards

Website: Ludwig Petterson, Jie Tang, Tom Brown, Alec Radford, Jonas Schneider, Szymon Sidor

World of Bits: Andrej Karpathy, Tianlin (Tim) Shi, Linxi (Jim) Fan, Jonathan Hernandez, Percy Liang

以下單位是 Universe 關鍵合作夥伴:EA, Valve, Microsoft, NVIDIA, Kongregate, Newgrounds, Yacht Club Games, Zachtronics, Ludeon Studios, Monomi Park, 2D Boy, Adam Reagle, Alvin Team, Rockspro, Anubhav Sharma, Arkadium, Beast Games, Char Studio, Droqen, Percy Pea, deeperbeige, Denny Menato, Dig Your Own Grave, Free World Group, Gamesheep, Hamumu Software, Hemisphere Games, Icy Lime, Insane Hero, inRegular Games, JackSmack, Nocanwin, Joe Willmott, Johnny Two Shoes, The Gamest Studio, László Cziglédszky, Madalin Games, Martian Games, Mateusz Skutnik, Mikalay Radchuk, Neutronized, Nitrome, ooPixel, PacoGames, Pixelante, Plemsoft, Rob Donkin, robotJam, Rumble Sushi 3D, SFB Games, Simian Logic, Smiley Gamer, Sosker, tequibo, kometbomb, ThePodge, Vasco Freitas, Vitality Games, Wolve Games, Xform Games, XGen Studios

關於如何操作使用 OpenAI Universe 的介紹以及其他具體內容,可以訪問官方博客介紹網頁:https://openai.com/blog/universe/


【OpenAI Universe】https://universe.openai.com/




(責編:WF)

新智元招聘

職位  運營總監

職位年薪:36- 50萬(工資+獎金)

工作地點:北京-海澱區

所屬部門:運營部

匯報對象:COO

下屬人數:2人

年齡要求:25 歲 至 35 歲

性別要求:不限

工作年限:3 年以上

語  言:英語6級(海外留學背景優先)

職位描述

負責大型會展贊助商及參展商拓展、挖掘潛在客戶等工作,人工智慧及機器人產業方向

擅長開拓市場,並與潛在客戶建立良好的人際關係

深度了解人工智慧及機器人產業及相關市場狀況,隨時掌握市場動態 

主動協調部門之間項目合作,組織好跨部門間的合作,具備良好的影響力

帶領團隊完成營業額目標,並監控管理項目狀況

負責公司平臺運營方面的戰略計劃、合作計劃的制定與實施

崗位要求

大學本科以上學歷,碩士優先,要求有較高英語溝通能力

3年以上商務拓展經驗,有團隊管理經驗,熟悉商務部門整體管理工作

對傳統全案公關、傳統整合傳播整體方案、策略性整體方案有深邃見解

具有敏銳的市場洞察力和精確的客戶分析能力、較強的團隊統籌管理能力

具備優秀的時間管理、抗壓能力和多任務規劃統籌執行能力

有廣泛的TMT領域人脈資源、有甲方市場部工作經驗優先考慮

有媒體廣告部、市場部,top20公關公司市場拓展部經驗者優先

新智元歡迎有志之士前來面試,更多招聘崗位請訪問新智元公眾號。


相關焦點

  • OpenAI的10億AGI夢何時實現?
    2019 年 7 月,微軟宣布對總部位於舊金山的人工智慧非營利組織 OpenAI 投資 10 億美元,將與 OpenAI 長期合作構建新的 Azure AI 超級計算技術,進一步擴展大規模 AI 能力,兌現其通用人工智慧(AGI)的承諾。
  • OpenAI 官方解密 ! AI 打Dota,你也可以
    OpenAI Five 掌握了成為人類隊友的基本能力,儘管在訓練過程中只是專注於擊敗其他 AI。如果將競爭性 AI 轉變為合作型 AI 比較容易的話,那麼未來 AI 系統將會對人類有很大幫助。 2. 從 4 月 18 日到 21 日,OpenAI 將開放一個專門的競技場,人類在該平臺既可以與 AI 組隊,也可以組隊與 AI 對抗。
  • AI Dota2雖完虐人類卻弱點頻現 | OpenAI Five親測報告
    OpenAI 自己也認為,大規模的競技場測試會回答一個重要的研究問題:OpenAI Five 在多大程度上可以被人類找到漏洞,進而被反覆擊敗。向「通用人工智慧技術」進軍OpenAI 本指望通過競技場為 AI 積累通用經驗,但如今可能會面臨一個數據較少的嚴峻考驗:人類只贏了 42 場,這對於動輒分析數萬場訓練數據的 AI 來說,實在是九牛一毛,它真的可以從中學到什麼嗎?
  • 人工智慧訓練師成為新職業 該如何「訓練」人工智慧?
    中國人力資源社會保障部、市場監管總局、國家統計局近日聯合發布智能製造工程技術人員等16個新職業,人工智慧訓練師名列其中。關於人工智慧訓練師的工作內容及其發揮的作用,俄羅斯衛星通訊社採訪了蘇州大學計算機科學與技術學院副教授許粲昊。
  • OpenAI追蹤AI模型效率:每16個月翻一番!超越摩爾定律
    每16個月效率翻倍推動人工智慧發展的有三個因素:算法創新、數據和算力。傳統上,算法的進展比算力和數據更難量化。算法效率可以被定義為減少訓練特定功能所需的計算量。效率是衡量經典計算機科學問題(如排序)的算法進度的主要方法。OpenAI表示,除了關注時下最新的最佳AI模型之外,公開衡量效率將描繪出算法進展的定量情況。
  • 《2020-2021中國人工智慧計算力發展評估報告》發布
    12月15日, IDC與浪潮聯合發布了《2020-2021中國人工智慧計算力發展評估報告》。報告從AI算力產業發展趨勢、市場規模、區域算力分布和行業AI算力保有程度等多個角度進行全面綜合評估,旨在評估中國人工智慧發展的現狀,為推動產業AI化發展提供極具價值的參考依據和行動建議。這是該報告自2018年發布以來,連續第三年發布。
  • OpenAI開課了!深度強化學習最全課程包,教程、代碼一網打盡
    大數據文摘出品作者:魏子敏、蔣寶尚繼谷歌和微軟的人工智慧實踐課程後,Elon Musk和Sam Altman主導創立的OpenAI剛剛也發布了一門教學+練手的全能課程「Spinning Up in Deep RL」,希望將他們最擅長的技術——深度強化學習能力分享出來,讓更多技術人掌握。
  • 微軟和谷歌的人工智慧,在SuperGLUE基準測試中超越了人類
    DeBERTa並不是全新的——它去年開源過——但是研究人員說他們訓練了一個包含15億個參數(模型用來做預測的內部變量)的更大版本。它將以開源的形式發布,併集成到下一個版本的微軟圖靈自然語言表示模型中,該模型支持Bing、Office、Dynamics和Azure認知服務等產品。
  • 對戰 DOTA2 世界冠軍 OG團隊,OpenAI 稱這將是最終決戰!
    OG 是由前「monkey」成員組成的新團隊。通過贏得 2017 年的 Kiev Major 比賽,OG 成為 Dota 2中第一支贏得四場 Dota 少年錦標賽的團隊。在去年 8 月的第八屆 DoTa2 國際邀請賽上,OG 團隊獲得冠軍,實力強勁。
  • 析通用電子產品功能測試平臺設計方案
    另外,在充分考慮當前電子產品測試存在問題的基礎上,結合新一代電子產品測試系統的發展特點,我們開發了電子產品功能測試軟體平臺(ElectronicTestPlatform,以下簡稱ETP),從而為構建通用電子產品功能測試平臺提供了很好的解決方案。圖1為通用電子產品功能測試系統原理圖。
  • 微軟投給OpenAI的一億美元出成果了!世界排名Top5的超級計算機
    大數據文摘出品來源:VB編譯:牛婉楊、笪潔瓊大約一年前,微軟宣布將向OpenAI投資10億美元,共同為微軟的Azure雲平臺開發新技術,並進一步擴展大規模人工智慧的能力,以兌現AGI(通用人工智慧)的「承諾」。
  • OpenAI 人工智慧5V5模式擊敗人類玩家(4000分水平)
    問題人工智慧的一個裡程碑就是在星際爭霸或者 Dota 這類複雜的電子遊戲中超越人類的水平。相比於上一個裡程碑,即西洋棋與圍棋,複雜電子遊戲開始反映真實世界的混亂與連續的本質。因此我們希望,能夠解決複雜電子遊戲的系統可以成為通用的、在遊戲之外有廣闊應用場景的系統。
  • AI開啟「泛在智能」時代:《2020騰訊人工智慧白皮書》重磅發布!
    在此背景下,未來人工智慧產業將如何發展?會帶來哪些機遇與挑戰?企業如何才能更好地抓住機遇實現智能化轉型?或許重新梳理2020年人工智慧產業的發展與變化能夠找到問題的答案。近日,騰訊研究院發布了《2020騰訊人工智慧白皮書》對人工智慧在產業趨勢、技術發展、抗疫應用、行業賦能、制度保障等方面進行了深度總結和梳理。
  • 人社部擬發布新職業,人工智慧訓練師成看點,舊職業模式漸行漸遠
    人工智慧的發展,推動了社會的全面進步。人工智慧促使陳舊的工作模式淘汰,融入一些人工智慧領域新職業。隨著社會的發展,一些圍繞著人工智慧的新工作崗位應運而生了。這是時代發展到一定階段的產物,順勢而為,是一種正確的職業導向。
  • 引燃AI社區,OpenAI新模型打破自然語言與視覺次元壁
    OpenAI 的新工作引起了 AI 圈的一陣歡呼。Coursera 創始人、史丹福大學教授吳恩達也表示祝賀,並選出了自己喜歡的「藍色襯衫 + 黑色長褲」AI 設計。下圖展示了「長頸鹿龜」這一新物種:奇怪的物種又增加了。零次視覺推理只需給出文本描述或提示,GPT-3 就能執行多種任務,且無需額外訓練。這種能力叫做「零次推理」(zero-shot reasoning)。而 DALL·E 將該能力擴展到視覺領域,在給出恰當提示的情況下,它能夠執行多種圖像翻譯任務。
  • 重磅發布開源框架、生物計算平臺螺旋槳,百度飛槳交了年終成績單
    本屆峰會,百度飛槳帶來八大全新發布與升級,有支持前沿技術探索和應用的生物計算平臺 PaddleHelix 螺旋槳,開發更加便捷的飛槳開源框架 2.0 RC 版,端雲協同的 AI 集成開發環境 BML CodeLab,支持更強大分布式訓練的業界首個通用異構參數伺服器架構,開源算法庫增至 200+,飛槳企業版 EasyDL 智能數據服務升級,飛槳硬體生態路線圖以及攜手全球開發者開啟
  • 助力「中國芯」提速 賽昉科技重磅發布性能領先的RISC-V天樞處理器...
    隨著人工智慧和物聯網技術的加速發展,從端到雲,高性能計算的新應用場景對晶片的性能和能效提出了新的高要求。為解決企業在多場景下處理複雜工作負載及高算力的爆發式需求,12月10日,我國領先的RISC-V處理器供應商——賽昉科技有限公司發布基於RISC-V的全球領先的高性能處理器內核天樞系列處理器。
  • 人社部擬發布16個新職業 人工智慧訓練師等入圍
    打開APP 人社部擬發布16個新職業 人工智慧訓練師等入圍 發表於 2020-01-05 07:55:00 經人社部同意,中國就業培訓技術指導中心近日發布《關於擬發布新職業信息公示的通告》,包括網約配送員、人工智慧訓練師、全媒體運營師、健康照護師、呼吸治療師等16個新職業。
  • 引燃AI社區,不用跨界也能從文本生成圖像,OpenAI新模型打破自然...
    OpenAI 的新工作引起了 AI 圈的一陣歡呼。Coursera 創始人、史丹福大學教授吳恩達也表示祝賀,並選出了自己喜歡的「藍色襯衫 + 黑色長褲」AI 設計。奇怪的物種又增加了。CLIP 旨在解決深度學習方法在計算機視覺領域中所面臨的的一些主要問題,如創建視覺數據集的人力和成本問題、數據集涵蓋的視覺概念過於狹窄、標準視覺模型只擅長一種任務且需要很多努力才能適應新任務、基準測試中表現良好的模型在壓力測試中表現糟糕等等。為此,CLIP 模型在多種多樣的圖像上進行訓練,這些圖像具備多種自然語言監督,並且很容易在網絡上獲得。
  • OpenAI發布120億參數圖像版GPT-3
    簡單來說,DALL·E 是一個有120億參數版本的GPT-3,利用文本-圖像對數據集進行訓練,輸入文本,生成相應圖像。 標準的圖像模型,聯合訓練圖像特徵提取器和線性分類器,預測一些標籤。CLIP再聯合訓練圖像編碼器和文本編碼器,從而預測一批(圖像,文本)對。