由馬斯克發起創辦的AI實驗室發布新型圖像生成器

2021-01-10 量子認知

OpenAI 是一個非營利的人工智慧研究組織,目的是促進和發展友好的人工智慧,使人類整體受益。OpenAI成立於2015年底,總部位於舊金山,組織目標是通過與其他機構和研究者的「自由合作」,向公眾開放專利和研究成果。創始人伊隆·馬斯克以及薩姆·奧特曼的動機是出於對強人工智慧潛在風險的擔憂。

OpenAI 的總部坐落於舊金山的米慎區,與馬斯克的另一公司Neuralink在同一個名為「先鋒大樓」(Pioneer Building)的大樓裡。

OpenAI培訓出了一款名為Dall-E的軟體,可以從短文字標題生成圖像。它演示了AI如何製作鱷梨和戴著芭蕾舞短裙的蘿蔔蘿蔔形狀的扶手椅。

OpenAI對稱為Dall-E的軟體進行了培訓,可以從一個短文字生成圖像。它專門使用了在網際網路上找到的包含120億張圖像及其標題的數據集。實驗室表示,Dall-E是西班牙超現實主義藝術家Salvador Dali的肖像手法,而Wall-E是來自同名皮克斯電影的小型動畫機器人,已經學會了如何為各種概念創建圖像。

OpenAI在周二發布的博客文章中展示了一些結果。該公司寫道:「我們發現Dall-E具有多種功能,包括創建擬人化的動物和物體版本,以合理的方式組合無關概念,渲染文本並將變換應用於現有圖像。」

Dall-E建立在神經網絡上,神經網絡是受人腦啟發的計算機系統,可以發現模式並識別大量數據之間的關係。雖然神經網絡之前已經生成圖像和視頻,但Dall-E並不常見,因為它依賴於文本輸入,而其他則不依賴於文本輸入。

近年來,合成視頻和圖像變得更加複雜,以至於人類已經很難區分真實和計算機生成的東西。例如,採用兩個神經網絡的通用對抗網絡(英語:General adversarial networks,縮寫:GAN)已被用來製作政客的假冒視頻。

OpenAI承認Dall-E具有「潛在的重大、廣泛的社會影響」,並補充說,它計劃分析Dall-E之類的模型如何「涉及社會問題,例如對某些工作流程和職業的經濟影響,模型輸出,以及這項技術帶來的長期道德挑戰。」

GPT-3後繼者

Dall-E出現在OpenAI宣布已建立名為GPT-3,即生成式預訓練(Generative Pre-training,GPT)的文本生成器,該生成器也由神經網絡提供支持。這種語言生成工具能夠按需生成類似於人類的文本,當人們意識到它可以編寫自己的詩歌、新聞文章和短篇小說時,它就以AI程序而聞名。

Dall-E是一個基於GPT-3的Text2Image系統,但接受了文本加圖像的培訓。Text2image並不是新事物,但是Dall-E演示在製作插圖方面出類拔萃,該插圖比過去幾年中看到的其他Text2Image系統更加連貫。

OpenAI一直在與DeepMind和Facebook AI Research Group等公司競爭以構建通用算法,該算法可以在人員級別及更高級別上執行各種任務。

研究人員已經建立了可以玩西洋棋和圍棋中國棋盤遊戲等複雜遊戲的AI,可以將一種人類語言翻譯成另一種語言,並在X光照片中發現腫瘤。但是,要讓AI系統表現出真正的「創造力」是業界的一大挑戰。

Dall-E的結果表明它已經學會了如何連貫地融合概念,連貫地融合概念的能力被認為是人類創造力的一種關鍵形式。從創造力的角度來看,這是一大進步。儘管對於AI系統「理解」某物的含義尚未達成共識,但是以新方式使用概念的能力是創造力和智慧的重要組成部分。

劍橋大學機器學習教授勞倫斯(Lawrence)將其描述為「這些模型在存儲有關我們世界的信息並以人類發現的自然方式進行概括的能力方面的鼓舞性展示。」 「我希望會有各種各樣的此類技術應用,我甚至無法想像。但是,作為另一種令人嘆為觀止的驚人技術來解決我們什至不知道自己實際遇到的問題,這也很有趣。」

OpenAI成立時是非營利組織,得到了包括馬斯克在內的一組創始人的10億美元認捐。 2018年2月,馬斯克離開了OpenAI董事會,但他繼續捐款並為該組織提供建議。

OpenAI在2019年實現了盈利,並從微軟那裡又籌集了10億美元來資助其研究,雙方將攜手合作替Azure雲端平臺服務開發人工智慧技術。2020年6月宣布了GPT-3語言模型,微軟於2020年9月22日取得獨家授權。GPT-3成為OpenAI的首個商業產品,社交新聞站點Reddit已籤署成為首批客戶之一。

#人工智慧#

相關焦點

  • 馬斯克被玩壞?這個變臉AI比StyleGAN還溜
    看看這濃密自然的鬍鬚,完全找不出破綻~惡搞馬斯克,StyleFlow算法的驚人效果近日,一個油管博主用AI惡搞出多個版本馬斯克的視頻,在YouTube上大火,效果逼真!比如,這個滿臉絡腮鬍光頭的中年版,仿佛讓人看到了多年後的馬斯克本人。還有這版長發飄飄的馬斯克,散發著一股女強人的氣質。
  • 欲駕馭AI,先與AI共生:馬斯克的「超人」計劃能成功嗎?
    ,並創辦腦機互聯公司Neuralink。 2020年5月13日,Facebook人工智慧部門負責人、卡耐基梅隆大學計算機科學家佩森蒂(Jerome Pesenti)發布推文,批評馬斯克在人工智慧方面不知所云,並認為現在還根本不存在人工通用智能這樣的事物,人工智慧的發展離人類的智能還差得很遠。
  • 中國完成首例AI+5G心臟手術!谷歌大腦新型優化器LAMB加速大批量
    手術期間的AI技術是由曾靠「貪心算法」成功追回被搶車的聖母大學計算機系終身副教授史弋宇團隊提供。這次手術也是AI在臨床上的一次落地應用。2.【業界 | 76分鐘訓練BERT!谷歌大腦新型優化器LAMB加速大批量訓練】來源:arXiv
  • 欲駕馭AI,先與AI共生:馬斯克的「超人」計劃能成功嗎?
    關注風雲之聲提升思維層次導讀為了最小化來自 AI 的生存威脅,馬斯克提出了讓 AI 力量變得「民有、民治、民享」的策略,並創辦腦機互聯公司Neuralink。是先知的指引,還是無知的妄想?他還表示,馬斯克以不能按時實現承諾而聞名,針對健康人的神經聯結或許要等到幾十年以後。2020年5月13日,Facebook人工智慧部門負責人、卡耐基梅隆大學計算機科學家佩森蒂(Jerome Pesenti)發布推文,批評馬斯克在人工智慧方面不知所云,並認為現在還根本不存在人工通用智能這樣的事物,人工智慧的發展離人類的智能還差得很遠。
  • Python文檔字符串生成器:基於CodeBERT,支持Google、Numpy等多種...
    基於CodeBERT的生成器跟正常的DocStrings用法一樣,你只需要輸入三引號「「」」」,之後按Enter,便能調用這個工具。就像這樣:並且,這個生成器還可以在幾種不同類型的文檔字符串格式之間進行選擇。而這個工具,不僅僅能夠幫助寫代碼的人,還可以方便後來人讀代碼。可以說是非常方便的一個擴展了。
  • AI也有藝術創造力!B612咔嘰攜手百度大腦打造各式風格圖像
    百度大腦圖像技術的11項「圖像效果增強」能力事實上,基於領先的深度學習技術,百度大腦在圖像技術中可實現多種圖像效果增強。例如去年十月,上海新聞晨報也曾快速調用百度大腦「黑白圖像上色」技術接口,推出「我為祖國添彩」H5互動活動。這也是一項複雜難懂的技術——AI對抗生成網絡技術,百度大腦的「AI對抗生成網絡技術」通過優化「生成器」記憶能力,高還原度地滿足了「給黑白圖像上色」的需求。而為了訓練該「生成器」,百度大腦在技術上還設計了一個「判別器」來評價生成的彩色圖像和真實彩色圖像的接近程度。
  • 來試試馬斯克孩子起名生成器,讓你的名字立刻脫離地球加入火星籍
    上期文章發出來後,這個腦洞大開的酷炫名字引起了讀者們的熱議:昨天,有好事者在Twitter上po了一個網站:「馬斯克會怎麼給你起名?」、只需要輸入你的名字,即可生成馬斯克風格的孩子姓名。然後是經常出沒於小學到高中期末英語卷子最後那道作文題的絕代雙驕Li Lei和Han Meimei:樸實無華的中國男孩兒Li Lei若是馬斯克的兒子,就會獲得一個著實酷炫的新ID。
  • 多模態 AI 系統?從文本直接創建圖像!OpenAI發布新人工智慧系統
    1月5日,人工智慧(AI)研究組織OpenAI重磅推出了最新的語言模型DALL·E和圖像識別系統CLIP。這兩個模型是OpenAI第三代語言生成器的一個分支。兩種神經網絡都旨在生成能夠理解圖像和相關文本的模型。
  • 美圖影像實驗室MTlab斬獲2019 CVPR-NTIRE圖像增強比賽冠軍
    近日,NTIRE(New Trends in Image Restoration and Enhancement workshop and challenges)比賽結果公布,美圖影像實驗室MTlab在圖像增強賽道(Image Enhancement Challenge)中斬獲冠軍
  • AI畫家躥紅,用GAN生成人像油畫,一秒回到文藝復興:伺服器擠爆
    MIT和IBM沃森聯合實驗室,發布了這隻畫師,名叫AI Portraits Ars,可以在線玩耍。但由於生成的畫像過於形神兼備,上線即遭網友大規模湧入,不到三天伺服器就崩壞了。這隻高能的AI,不止能拿著照片作畫,看著視頻也沒問題。
  • 馬斯克的物理作業堪稱外星文,網友:看不懂
    人才是這個世界上最珍貴的,各個國家之間比拼科技、比拼軍事、比拼教育,最主要的還是人才的比拼,畢竟一切事物都是由人類進行創造的,人類的思維不斷的更新,所生產出的事物也在不段更新。埃隆·馬斯克是誰?他出生於南非的首都,一個人擁有南非、加拿大、美國三個國家的國籍,現在是太空探索技術公司的總裁。在1995年至2002年,他和合伙人先後創辦了三家公司。
  • 大腦與AI也能融合?馬斯克將發布腦機最新進展
    近日,馬斯克放話將在8月28日公布腦機接口Neuralink的最新進展。他表示,藉助Neuralink技術人腦可以克服阿爾茨海默氏病、中風等疾病。最重要的是,它將讓人類與AI高度融合,即使肉身倒下,人類也能通過Neuralink實現數位化「永生」。
  • 除了實時光線追蹤,英偉達圖靈架構還有這些AI圖像處理能力
    Adobe上的AI圖像處理插件在上周舉辦的計算機圖形學年度會議SIGGRAPH 2018上,英偉達發布了全新的圖靈架構,隨後展示了一系列用於Photoshop和Premiere的插件。據雷鋒網了解,Inpaint這個技術由英偉達Guilin Liu領導的團隊開發,運用了最先進的深度學習方法,可以編輯重建損壞的圖像,同時也可以通過移除部分圖像並重新填充來編輯圖像。「我們的模型可以穩健地處理任何形狀、大小、位置距離的圖像破洞。
  • AI每日精選:北京地鐵研究刷臉安檢;LG電子波士頓開設機器人實驗室
    大公司新聞1.LG電子將在波士頓開設機器人實驗室LG 電子近日表示,它將在美國開設一個機器人實驗室,以提高其在機器人技術方面的競爭力。該實驗室將於本月晚些時候在波士頓開放。2.消息稱蘋果2億美元收購人工智慧初創公司Xnor.ai消息人士透露,蘋果公司收購了西雅圖初創公司 Xnor.ai,後者是一家專業致力於研究設備人工智慧技術的公司。消息人士稱,蘋果公司以大約 2 億美元的價格收購了 Xnor.ai。
  • 吳博:目標檢測集成框架在醫學圖像 AI 輔助分析中的應用 | AI 研習...
    近日,在雷鋒網 AI 研習社公開課上,深圳市宜遠智能科技有限公司負責人吳博剖析了目標檢測已有的框架,重點分享如何對目標檢測框架進行改造,以便在醫學圖像分析中產生更好的效果。公開課回放視頻網址:http://www.mooc.ai/open/course/559?
  • 零基礎入門深度學習(六):圖像分類任務之LeNet和AlexNet
    02 圖像分類概述圖像分類是根據圖像的語義信息對不同類別圖像進行區分,是計算機視覺中重要的基礎問題,是物體檢測、圖像分割、物體跟蹤、行為分析、人臉識別等其他高層次視覺任務的基礎。圖像分類在許多領域都有著廣泛的應用,如:安防領域的人臉識別和智能視頻分析等,交通領域的交通場景識別,網際網路領域基於內容的圖像檢索和相冊自動歸類,醫學領域的圖像識別等。
  • Waymo利用AI生成攝像頭圖像 用於自動駕駛仿真
    SurfelGAN中的生成對抗網絡(GAN)模塊負責將表面元素圖像渲染轉換成逼真的圖像。其生成器模型從使用分布採樣的隨機噪聲中生成合成示例,這些示例連同來自訓練數據集的真實示例一起反饋給鑑別器,而鑑別器視圖區分這兩者。生成器和鑑別器的能力不斷提升,直到鑑別器無法區分合成示例和真實示例。
  • 全球三十大最佳 AI 創業公司公布
    Clarifai 成立於 2013 年,專注計算機視覺領域,公司在同年 ImageNet 2013 大賽中獲得圖像分類組前五名,至今一直處於行業領先地位。2017 年,H2O.AI 發布了 Driverless AI,這項產品可以實現機器學習流程高度自動化,對非技術型的終端用戶同樣適用。公司客戶包括 Capital One、Comcast、AT&T 和 Kaiser,並和 AWS 和 Azure 建立了合作。目前,H2O.ai 已完成 4000 萬美元 C 輪融資。
  • 8月28日,馬斯克將發布腦機接口最新進展,生化人時代開啟?
    特斯拉和SpaceX公司創始人馬斯克周四在推特上宣布,8月28日將發布腦機接口公司Neuralink的最新進展情況。但他這條消息卻是在回復另一條更刺激的消息時寫的,這就讓人遐想連篇了,難道馬斯克真的要繼特斯拉、可重複使用火箭、天基網際網路之後,發布第四個改變人類歷史進程的產品了嗎?
  • Facebook AI 年度總結來啦
    我們提出了新的研究,除了圖像識別上的進展,在NLP領域,我們現在可以用較少的監督數據翻譯更多的語言。我們發布了許多平臺和工具來幫助其他人將他們的人工智慧研究轉化為生產應用程式,包括我們將目前流行的開源深度學習框架 PyTorch 升級成新的、更通用的 1.0 版本。