GANs 造假術領銜,看 2018 最具落地潛力的 9 大 AI 技術趨勢

2021-01-11 雷鋒網

雷鋒網 AI 科技評論按:本文是 Alex Honchar 在 Medium 上發布的三篇系列博客之二。這三篇博客分別從 AI 研究者、產業界的應用開發人員、普通人的角度介紹了作者對於 2018 年人工智慧發展趨勢的看法。雷鋒網(公眾號:雷鋒網) AI 科技評論對原文進行了編譯。

在第一篇 AI 研究趨勢的文章中我嘗試介紹了 2018 年人工智慧研究領域中可能發生重要發展的方向。儘管做人工智慧的理論研究很酷,但是也存在一些具體的 AI 技術,它們在 2017 年已經成熟並且將有可能在 2018 年得到大規模的商業應用。這也正是本文所要探討的內容——我將向你介紹一些技術,這些技術也許可以應用到你當前的工作中,或者用於構建自己的初創項目。

重要提示:本文給出了一份 AI 領域算法或技術的盤點,它們已經相當成熟,這意味著可以直接使用。例如,你可以在盤點中看到時間序列分析(Time series analysis),因為深度學習正在信號處理領域迅速替代傳統的優秀方法。但是在這份盤點中,你看不到強化學習(Reinforcement learning),儘管強化學習也許更加好玩,但是在我看來,它當前還不夠成熟,不足以應用到商業開發中去。但是強化學習確實是一個令人驚嘆、日新月異的研究領域。

再次提醒一下,這是三篇系列文章的其中一篇,在這個系列文章中我嘗試從三個不同的角度分享我對人工智慧在未來一年發展趨勢的看法

希望各位讀者能找到自己喜歡的內容,並且有所收穫!

PS:在本文我不介紹圖像識別和一些簡單的計算視覺問題,畢竟這塊已經發展好幾年了。

GANs 和造假術

雖然生成對抗網絡(Generative adversarial networks, GANs)已經被提出來好幾年了,我依然對它非常懷疑。並且儘管生成對抗網絡已經在 64x64 解析度的圖像上取得了巨大的進步卻依然無法打消我的疑慮。然後在我閱讀了相關的數學文章之後,我更加懷疑生成對抗網絡事實上並沒有學習到數據分布。但是這一點在今年有所改觀,首先是新穎有趣的架構(如 CycleGAN)的提出和理論性的提升(Wasserstein GAN)促使我在實踐中嘗試了生成對抗網絡,然後它們的效果也還可以。另外在兩次應用過生成對抗網絡之後,我開始被它深深折服,並且開始堅信我們必須使用生成對抗網絡進行對象生成。

首先,我非常喜歡英偉達的關於生成真實逼真的全高清圖像的研究論文(前一年僅能實現 64x64 的圖像生成):

但是我真正喜歡的(作為一個騷年的完美夢想應用程式),並且讓我留下深刻印象的是生成假的色情電影:

我也看到了生成對抗網絡在很多遊戲行業中的應用。比如用 GAN 生成景觀、英雄乃至整個世界。而且我認為生成對抗網絡造假的能力將越來越強。

神經網絡的統一格式

現代發展(不只是 AI 領域)的一個重要問題是,我們往往可以擁有幾十個不同的框架來做同一件事情。現今,每個進行機器學習研究的大公司都必須擁有自己的框架:谷歌、Facebook、亞馬遜、微軟、英特爾,甚至是索尼和優步以及許多的其它開源方案!在單個 AI 應用中我們會希望採用不同的框架,比如計算機視覺問題採用 Caffe2,NLP 採用 PyTorch,推薦系統採用 TensorFlow/Keras。然而接下來將這些模塊合併卻需要花費大量的開發時間,這使得數據科學家和軟體開發人員無法將注意力集中於更重要的任務中。

該解決方案必須是一個統一的神經網絡格式,它可以輕易地從任意框架中獲得,然後開發人員可以輕易實現部署,科學家可以輕易上手使用。而這就是 ONNX:

事實上,它只是非循環計算圖(Acyclic computational graphs)的簡單格式,但在實踐中它給我們提供了部署複雜 AI 應用方案的機會。而且我個人發現它非常有吸引力的一點是——人們可以在那些沒有強大部署工具和不依賴於 TensorFlow 生態系統的框架中進行開發,比如 PyTorch。

模型庫暴增

三年前,人工智慧領域最令人興奮的事情是 Caffe 的模型庫(Caffe Zoo)。當時我正在從事與計算機視覺有關的工作,我當時嘗試了所有的模型,並且逐一檢查了它們的工作機制以及運行效果。之後我使用這些模型進行實現遷移學習(Transfer learning)或者用於特徵提取。最近我使用了兩種不同的開源模型,作為一個大型計算機視覺任務的數據流處理管道的一部分。這意味著什麼呢?這意味著實際上我們沒必要去訓練自己的網絡模型,例如,對 ImageNet 對象識別或者地點識別,這些基礎的東西能夠直接下載並添加到你的系統中去。除了 Caffe 模型庫,其它的框架也有著類似的模型庫。但是讓我最吃驚的是,你可以直接將計算機視覺、NLP 甚至是加速度計信號處理模型插入到 iPhone 中:

我認為這些模型庫將越來越多,並且會出現像 ONNX 這樣的生態系統,然後這些模型也將更加集中(也會使用 ML 區塊鏈應用來去中心化)。

AutoML 設計方法替換

設計一個神經網絡的體系結構是一個痛苦的任務——有時你可以通過簡單地堆疊卷積層得到相當好的結果,但是大多數時候,你需要憑藉經驗和超參數搜索方法(例如,隨機搜索或貝葉斯優化)非常仔細地設計網絡的寬度、深度和超參數。特別是當你不在計算機視覺領域開展研究時,你可以微調一些在 ImageNet 上訓練的 DenseNet。但是對於 3D 數據分類或者多變量時間序列應用則不行。

有許多人嘗試過使用一個神經網絡從頭開始創建另一個神經網絡架構,但是對我而言,最好的也是最便捷的是 Google Research 的 AutoML:

他們用 AutoML 來生成的計算機視覺模型,比人類手工設計的網絡還要更快和更好。我相信很快就會有很多關於這個話題的論文和開原始碼了。

技術棧

對於這個概念,我在 Anatoly Levenchuk 的博客上看到了很多。Anatoly Levenchuk 是一名來自俄羅斯的系統分析師、教練和 AI 愛好者。在下面的圖片中,你可以看到一個被稱為 「AI 棧」的例子:

它不僅僅包含有機器學習算法和你最喜歡的框架,而且也深入更底層中,並且每個層面都有自己的發展和研究。

我認為人工智慧開發行業已經擁有了足夠多的不同專家,而且已經足夠成熟。在你的團隊中只有一名數據科學家是遠遠不夠的——你需要不同的人員,分別負責硬體優化、神經網絡研究、AI 編譯器、解決方案最優化和生產實施。在他們之上必須有不同的團隊領導、軟體架構師(必須為每個問題單獨設計上面的堆)和管理者。我已經提到了這個概念,希望在 AI 領域的技術專家能夠在未來成長(對於那些想要成為 AI 或者技術領導者的軟體架構師——你需要知道學習路線)的某種願景。

基於語音的應用

目前來說人工智慧所能解決的精度能達到 95% 以上的問題非常少:我們可以將圖像分成 1000 個類別;我們可以判斷文本中的情緒是正面的還是負面的;其實我們還可以做一些更加複雜的事情。我認為還有一個領域即將迎來商業應用的爆發,那就是語音識別和生成。事實上,在 DeepMind 的 WaveNet 發布之後的一年內,WaveNet 都還算不錯,不過由於最近百度的 DeepVoice 和 Google Tacotron2 的提出,我們在這塊走的更遠了:

這個技術很快就會在開源社區中進行公布(或者被一些聰明人所複製),並且每個人都能夠以非常高的精度識別語音並生成它。它能在哪裡派上用場呢?我們將得到更好的私人助理、自動電子書閱讀器、談判記錄器(Negotiation transcripters)以及聲音造假。

更聰明的機器人

我們今天所看到的機器人都有一個很大的問題——其中 99% 根本不是人工智慧,它們只是硬編碼。這就是為什麼 Facebook Messenger 或 Telegram 中的大部分機器人都採用硬編碼的命令,或者最好情況也是採用了一些基於 LSTM 和 word2vec 技術的神經網絡句子分類器。但是現代最先進的 NLP 技術可不止這樣。來看看 Salesforce 做了哪些有趣的研究工作:

他們正在構建 NLP 與資料庫的接口,克服現代編碼器-解碼器自動回歸模型,不僅能為單詞或句子訓練嵌入向量,而且還能給字符訓練向量。此外,還有一個有趣的研究是關於使用強化學習將 NLP 得分作為 ROUGE 進行最優化

我相信隨著這些技術的發展,我們可以通過更多的智能信息檢索(Intelligent information retrieval)和命名實體(Named entity)來提高機器人。甚至在一些封閉域的垂直應用中可能出現完全由深度學習驅動的機器人。

最佳的時間序列分析

在 Salesforce 之後的第二個被低估的公共機器學習研究實驗室是 Uber AI Labs。前端時間,他們發表了一篇博客,展示了他們對時間序列預測的方法。說實話這讓我感到受寵若驚,因為我在應用程式中使用了基本相同的方法!這是統計特徵和深度學習表徵相結合的驚人例子:

我最近從事的是基於深度學習的時間序列分析,我已經親自驗證了這個神經網絡效果非常好,與「黃金標準(Golden standards)」相比,你可以輕易獲得 5-10 倍的性能增長

優化策略也很重要

我們要如何訓練我們的神經網絡?說實話,大多數人只是使用「Adam()」優化函數和標準的學習率。而一些聰明的人會選擇最合適的優化器,並調整合適的學習率。由於訓練優化的時候我們只需要按下「訓練」按鈕,然後等待網絡收斂,因此這導致人們往往低估了優化中的學問。但是在擁有同等計算力資源、內存和開原始碼解決方案的時候,能夠在最短時間內優化訓練模型的人將勝出。這有一篇 2017 年優化算法的改進盤點。

我鼓勵大家看看上面的 Sebastian 的 Ruder 博客,該博客介紹了 2017 年最新的一些關於如何確定優化算法,以及其他一些非常有用的簡單改進。

回歸理性

這張照片能告訴我們什麼呢?特別是在已經閱讀了這篇文章前幾點之後。考慮到目前已經出現了這麼多開源的工具以及算法,要開發出一些新的有價值的東西並且還要從中賺取很多錢並不容易。我認為 2018 年對於像 Prisma 這樣的創業公司來說不是最好的一年——因為可能會出現很多競爭對手,他們可以把開源項目作為移動應用進行部署,從而開始創業。

今年我們必須專注於基本的事情,而不是掙快錢——即使我們打算使用谷歌的 Ratacon 服務來實現有聲讀物的語音識別,我們也不能單純地將它作為一個簡單的網絡伺服器,而是要想清楚業務模式、合作夥伴以獲得一些投資。

總結

最後再總結一下,我們有幾種技術可以用於實際產品落地:時間序列分析、GANs、語音識別。我們不應該再為分類或者回歸設計基本架構了,因為 AutoML 將會為我們實現這個。我希望藉助一些優化上的提高,AutoML 將運行得比以前更快。然後有了 ONNX 和模型庫之後我們將能夠通過兩行代碼就實現將模型插入到應用中去。我認為製作基於 AI 的應用程式在當前來說是非常容易的,這對於整個工業界而言也是福音。而想知道新一年裡人工智慧研究領域會如何發展請看我前一篇文章。

Via AI in 2018 for developers,雷鋒網 AI 科技評論編譯

相關文章:

2018 年最值得期待的學術進展——致人工智慧研究者們的年終總結

2017年裡,哪十篇 arXiv 機器學習論文在 Twitter 上最熱門?

2017年度好視頻,吳恩達、李飛飛、Hinton、OpenAI、NIPS、CVPR、CS231n全都在

告別高潮迭起的 2017,2018 年人工智慧將走向何方?

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 妙筆智能奪得機器之心年度中國十大最具潛力早期AI公司
    2020-01-17/15:30 機器之心年度獎項Synced Machine Intelligence Awards是一個具有行業發展趨勢啟示性的獎項
  • 【一張圖】看遍20大未來最具潛力新材料!
    【一張圖】看遍20大未來最具潛力新材料!發表時間:2016/3/29 3月25日,新材料在線產業研究院發布了2016年度20大未來最具潛力新材料。
  • 盤點|2018上半年區塊鏈公鏈誰最具價值和潛力?
    不知不覺中,2018年過半,在著過去的半年中,科技領域過火的莫過於區塊鏈!2018年被視為區塊鏈元年,也是區塊鏈應用走入線下真正開始的一年。俗話說,萬丈高樓平地起,條條大路從頭鋪,整個區塊鏈行業尚處於發展的初期階段,打基礎註定是今年行業的主調,否則,基礎架構沒有搭建起來,再好的應用也難以落地。
  • 「乳腺癌最具潛力靶點」-CDK4/6國內玩家增至9個
    CDK4/6被業內人士稱為"乳腺癌最具潛力靶點",2018年全球市場規模接近46億美元,其中,代表藥物輝瑞的哌柏西利2018年全球銷售額41.18億美元,位列2018全球最暢銷藥第10名。隨著豪森的加入,國內CDK4/6玩家增至9個。"乳腺癌最具潛力靶點"-CDK4/6-乳腺癌2018 年全球癌症年報顯示,在全球範圍內(包括中國),乳腺癌位居女性惡性腫瘤發病率的首位。
  • 潛力無限 未來可期——遠東榮膺中國「最具發展潛力僱主」
    11月29日,花城廣州,璀璨盛放,在2019中國年度最佳僱主頒獎盛典暨中國人力資本國際管理論壇上,遠東控股集團從50096家企業中脫穎而出,榮膺中國「最具發展潛力僱主」,一同獲此榮譽的還有漢堡王、藍月亮(中國)、綠城中國、隆基綠能科技、瑞幸咖啡、金風科技等行業頭部企業,共計30家。
  • 產業| 未來最具潛力新材料TOP10大盤點
    產業| 未來最具潛力新材料TOP10大盤點 2019-07-12 16:56 來源:澎湃新聞·澎湃號·媒體
  • 未來五年最具潛力的行業是什麼?
    所以,討論未來五年最具有潛力的行業,其實在很大程度上是討論未來五年最具有科技潛力的行業。如果同意這一點,那就繼續往下看。一、虛擬實境這一篇注重科普和宏觀描述,資深科技愛好者可以略過。如果要考察科技的發展規律,就必須知道所謂的「加納曲線」:科技熱點在第一輪火熱起來後,一般不會持續熱,而是熱度很快衰退,等一段時間之後才會再熱起來。
  • 智能創新計算:量子計算潛力巨大、AI落地改變各行各業
    9月20日,在國家超級計算深圳中心舉行的2020年科技專家研討會上,多位科技專家聚焦智能創新計算展開研討。┃量子計算表現出巨大潛力「機器人正在改變我們的物理世界!」研討會上,國際歐亞科學院院士、深圳市人工智慧與機器人研究院執行院長李世鵬表示,以大數據驅動的深度神經為代表的人工智慧技術正蓬勃發展,推動一系列重要應用落地,從而改變我們的生活。
  • 解決全球變暖最具潛力的技術
    報告認為最具潛力的技術:  1.碳捕獲法  技術設想:用高大的碳捕獲裝置吸收空氣中的二氧化碳,並將其注入地下或轉化為石灰巖。美國哥倫比亞大學物理學家克勞斯·拉克納是該技術的代表人物。  5.空基反射法  技術設想:在地球軌道上部署由眾多鏡子組成的「太陽盾」,來抵禦或減少太陽輻射,從而為地球降溫。  報告評價:如果部署和維護的問題能得到妥善解決,也可以被看作是一種有潛力的技術。但目前的問題是,整個系統過於複雜和昂貴,且不能直接減少二氧化碳。
  • 【技術綜述】有三說GANs(上)
    【9】Karras T, Aila T, Laine S, et al. Progressive growing of gans for improved quality, stability, and variation[J]. arXiv preprint arXiv:1710.10196, 2017.【10】Mao X, Li Q, Xie H.
  • 20大未來最具潛力新材料震撼發布(內附秘制視頻)
    3月25日,由新材料在線舉辦的「2016 新材料資本技術春季峰會」在深圳五洲賓館成功召開。作為峰會的重磅環節之一,新材料在線產業研究院院長聶雷主持發布2016年度20大未來最具潛力新材料。【20大未來最具潛力新材料】視頻:視頻來源:YouTube,新材料在線剪輯整理
  • 顯示技術微發光二極體(MicroLED)在AR/VR顯示裝置應用最具潛力
    顯示技術微發光二極體(MicroLED)在AR/VR顯示裝置應用最具潛力 作者:51Touch時間:2017-10-31 來源:TechNews
  • 全球三十大最佳 AI 創業公司公布
    、市場與行業潛力、運營能力、資本與財務狀況、創新性與實用性等多項標準,評選出四項大獎:全球三十大最佳 AI 創業公司、中國十大最強 AI 研究實力企業、中國十大最具潛力早期 AI 公司、三十大最佳 AI 應用案例。
  • 2018 公開課盤點企業篇:十家企業帶你看 AI 的實際應用成果及人才...
    公開課中,他不僅詳細介紹了知識圖譜的概念、企業機遇挑戰、知識圖譜賦能企業數位化轉型以及知識圖譜落地挑戰與趨勢,最後也為各位小夥伴們呈上了該公司的招聘需求。而數據分析師入行需要的技術能力較易,轉行/自學性價比極高,成為大數據領域的熱門職業。
  • 由動點科技呈獻的CES Asia Startup Awards 2018獲獎名單正式揭曉
    動點科技資深記者與優秀獲獎企業就可穿戴技術如何改變醫療保健及如何做出一款好的AI落地產品這兩個話題展開深入對話,深度剖析行業形勢,帶來精彩的話題和碰撞。面對每一次科技革命的到來,誰能真正把握住新科技革命的趨勢、特徵和戰略先機,誰就有可能在未來發展中獲得領先優勢。作為中國極具影響力的科技媒體,動點科技一直致力於發現中國和全球的創新力量。由動點科技主辦的ChinaBang Awards歷經8屆,搜索並發現了無數最有潛力、有價值的創業項目,已然成為極具權威性、開放性、公信力的評選盛會。
  • 百分點科技入選機器之心最具產業價值技術應用落地案例TOP30
    百分點科技憑藉在深圳市智慧應急數據底座搭建項目中體現出的深厚技術實力和極高的業務價值,從眾多參選案例中脫穎而出,成功入選「最具產業價值技術應用落地案例TOP30」榜單。其中「最具產業價值技術應用TOP30」榜單主要關注近兩年落地實踐的數位化轉型、產業智能化升級案例及相關成果,從幫助客戶實現生產效率、生產成本優化,市場競爭力提升,及標杆示範場景價值等維度進行考核。百分點科技助力深圳市智慧應急搭建數據底座的項目,通過嚴格的評選成功入選該榜單。
  • 同濟大學發布「十大最具轉化潛力科技成果」 將全力推進優秀科研...
    ,助力汙水處理廠提標擴容的高濃度複合粉末載體生物流化床技術,防止水體富營養化的水體微生物活化原位修復技術,檢測血液自身抗體的肺癌早期診斷試劑盒,治療難治性皮膚病療效顯著的新型實時可控無痛光動力治療智能系統,對癌症進行高效、靈敏檢測的新型循環腫瘤細胞檢測納米技術……12月22日下午,同濟大學「2020年度十大最具轉化潛力科技成果」發布。
  • 輝瑞最具潛力10大在研藥物
    公司每年花費上百億美元進行研發活動,截止2018年7月31日,輝瑞的研發管線藥物有98個,其中11個處於申報階段,30個處於III期臨床研發階段。下面,將綜合分析一下輝瑞最具潛力的10大在研藥物。最近,Tanezumab再傳捷報,2018年7月,輝瑞和禮來共同宣布,該藥在用於骨性關節炎疼痛管理的Ⅲ期試驗中,達到了所有3項試驗終點。9、PF-049658422018年2月, FDA授予PF-04965842為治療中重度特應性皮炎(AD)的突破性療法。
  • 盤點未來10大最具潛力的鋰電池新材料
    盤點未來10大最具潛力的鋰電池新材料發表於:2017-08-01 00:00:00     來源:革新納米的發展正處於一個瓶頸期,能量密度已經接近其物理極限。我們需要新的材料或者技術去實現鋰電池的突破,以下幾種電池材料被業內人士一直看好,或將成為打破鋰電池障礙的突破口。
  • 二十大未來最有潛力的新材料
    新材料技術與納米技術、生物技術、信息技術相互融合,結構功能一體化、功能材料智能化趨勢明顯,材料的低碳、綠色、可再生循環等環境友好特性倍受關注。 本文綜合國內外知名研究機構和公司研究進展、科技媒體評論以及行業熱點研究初選出20大新材料,以下為相關材料的詳細信息(排名不分先後)。