科研領域和工業領域都在進行的AI研究有什麼不同

2020-11-25 網易科技

(原標題:學界與工業界的AI研究有什麼不同)

顏水成

現在不少學界的科學家都到公司裡做研發,那麼,在工業界從事研發和以前在學界究竟有哪些不同?很多關心研發的人會有這樣的疑問。

去年,講到人工智慧時人們會談到它具有「三要素」:算法、算力和數據;從今年開始,把場景加入進來,開始用「四元分析」的方式來理解人工智慧。加入場景非常重要的原因是人工智慧終究是一種技術,人工智慧必須要落實到精準的場景,才有它實實在在的價值。

    學術界追逐精度的極限

人工智慧的概念實在太大了,現在深度學習最熱,學術界裡研究深度學習會做些什麼事情呢?

一般情況下,學術界把問題設立好後,去思考研究一些新的算法,然後在具體的問題上,力圖在精度上達到極限。從深度學習上設計更好的模型結構方面,過去這些年,像最初的Hinton用最基本的網絡結構,到谷歌的GoogleNet,微軟的殘差網絡(ResNet),可以看到基礎網絡結構是推動學術界往前走的核心。但是除了基本的網絡結構之外,更大的網絡、更深的網絡以及不同的網絡模型的融合,也是大家追逐精度的常用方法。

另一方面,我們要訓練這些網絡,可能需要更多的計算資源,比如需要圖形處理器集群(GPU Cluster),比如希望有更便捷的訓練平臺,像Caffe、MxNet、Tensorflow等等。當然,更重要的是大家在一點點往前推動的同時,積累了很多小的經驗,這些經驗通過學術報告、論文的形式來分享。

大家都站在巨人的肩膀上一步一步往前走。當然,還有怎麼樣用其他的非標註的數據來提升解決問題的能力。所有的一切都結合在一起,在解決具體問題的時候,能夠把精度達到極限。

學術界很多時候研究的目的,是要有成果論文發在最頂級的學術雜誌上,也希望這些算法能夠具有普適性,除了能解決自己的問題,其他人也能借鑑,最好能開源,所有人都可以去使用,這樣就能很好地提升自己在這個領域的影響力。

    沒有瑕疵的用戶體驗如何產生

但工業界不是這樣。工業界要去探索商業,註定要有經濟上的考慮,思考盈利模式,那對人工智慧的考慮就會不一樣。

在工業界待過就會明白,人工智慧本身並不是一個產品,不是單純靠人工智慧就能獲得利益,必須要與自己的業務和場景相結合,才能發揮它的價值,核心算法只是其中的一個模塊而已。無論是往前端走,還是往後端走,還是需要很多不同類型的人,才可以做出一個產品。

最重要的是,人工智慧並不是一個靜態的東西。比如說訓練出來的模型,要用到某個業務場景裡面,業務場景裡產生新的數據,這些數據進一步提升人工智慧模型的能力,再用到場景裡面,這是一個閉環和不斷迭代的過程。

另一方面,也是很多從學術界到工業界的教授和學者很容易犯的一個很嚴重的錯誤,就是認為技術在真正推動產品。但其實,用在具體的場景裡面,技術只是起到一個非常小的作用,它的貢獻大概30%到40%就不錯了。

一個成功的產品,還需要產品工程師和非常多的人,大家一起才能做出一個具備非常完美的用戶體驗的產品出來。一個核心點就是我們做技術的人,做研究的人,要明白永遠沒有完美的算法,算法永遠是有瑕疵存在的,我們一定要和場景工程師在一起,通過好的產品設計,把這些算法上的瑕疵避免掉,打造沒有瑕疵的用戶體驗。

此外,除了考慮用戶體驗,工業界設計一個產品還會考慮其他方面。比如,當前把視覺,語音和相關的技術用在智能硬體上的時候,工業界可能會想,到底這個產品能不能滿足某種高頻的剛需?

工業界還會考慮一款產品用到的技術有沒有成熟?比如說家用機器人,可以端茶送水,可以聊天,這是不可能的,技術上還有一個過程。

另外,工業界還會考慮技術成熟了,但有沒有壁壘?假設沒有技術壁壘的話,今天做一個產品出來,比較前沿的大公司,都有專家團隊,你把這個產品做出來立馬又失掉了,技術上的壁壘也一定要有。

另外一方面,就是學術界想得最少的:我們做一個場景,一定要有變現的模式。沒有一個變現的模式,產品出來了,但是今後掙不了錢,也不可能讓這個公司維繫下去。

    用四元分析來看學界和工業界的區別

總的來說,學界進行人工智慧、深度學習的研究,一直是在追求精度和極限。用四元分析的方法來說就非常有意思,即場景和數據確定了,然後設定一個問題,設定一個數據集,假設有足夠多的計算機資源,怎麼樣設計新的算法,讓精度能夠達到極限?

有很多的數據集,比如ImageNet,號稱人工智慧的世界盃;人臉研究界有LFW(人臉圖片的資料庫,用來研究不受限的人臉識別問題);在視頻領域有美國組織的TRECVID;語音的話有Switchboard。他們共同特點就是:問題和數據都是確定的,用儘量多的計算機資源,去設計不同的算法,最終希望達到精度的上限。

但不得不承認,很多成果是沒辦法商業化的。為什麼?在ImageNet上,假設訓練了1000多層的網絡,把9個或更多網絡全部合在一起能達成一個很好的精度,在現實的場景下是不可能用這麼大的模型和這麼多的資源去做一件事情。所以,很多的成果,是假設將來計算能力達到一定的程度,精度能夠達到這個上限。

AI研究的另外一個維度是追求用戶體驗的極限。用四元分析的方法,是把場景和算力固定了。這是什麼意思?假設我們要做一個機器人,希望它能識別你,這時候場景是確定的。算力確定了是說,這個場景推出的時候,用什麼樣的晶片和什麼樣的硬體,其實已經確定了。我們要做的事情是在這樣一個確定場景和算力的情況下,怎麼樣去提升數據和算法,跟具體的應用場景去形成一個閉環,去不斷地迭代,去提升它的性能。這跟學術界把場景和數據固定是完全不一樣的。在這種場景下,可以不停地用收集到的新數據不停提升和優化模型,在數據、算法和場景三要素中形成一個閉環。雖然我們能把所有的問題解決,但是在具體的場景下,也有可能逐步地提升它的性能。

這時候做的事情很有意思——要做很多數據的清洗、標註。為了把產品的價格降低,比如用一個很差的CPU就能夠去做計算,肯定要不停地去優化模型的速度。另一方面,很多時候,滿足這種體驗的需求會使一些新的問題誕生出來。

仔細想一想,學術界多數做的事情是在思考,在想它的極限在哪,主要用腦;工業界並不是強調用腦,而是用心——就是怎麼樣能把這個場景做出來,並不一定要有非常高大上的算法,就是要從用戶使用產品的維度上,讓用戶感覺這個產品非常好。

學術界和工業界又不是完全割裂的:工業界敢去提某一個產品的設想,是看到了在學術界有一些前沿的成果,可以在工業界來用。同時,工業界也在逐步提煉它的問題,扔給學術界,希望他們去做這種前沿的探索。比如說工業界可以想,三年、五年以後會往哪些方向去推動,他就可以把這些任務推給學術界。

在人工智慧、深度學習的研究領域,學術界和工業界的差別還是很大的,同時也相互作用,相互增強。學術界和工業界一起合作,研究和產業相結合,一定會把人工智慧帶上另外一個階段。

本文來源:科技日報 責任編輯:侯維鋮_NT4124

相關焦點

  • AI 領域掀起 ReID 研究熱,未來有哪些新的探索方向?
    但在計算機視覺領域,另一項技術的重要性也不遑多讓,那就是行人重識別(ReID)技術。ReID:計算機視覺研究的新風口行人重識別(Person Re-Identification,簡稱 ReID)也稱作跨鏡追蹤技術,是當前計算機視覺領域的熱門研究方向。
  • 科學研究領域也涉獵?工業顯示器解鎖掃描電子顯微鏡應用!
    科研領域作為新技術的發源地,一直以來都受到國家的高度重視。在研究實驗室中,各類輔助設備作為科研工作者的有力助手,擔任各種各樣高精密實驗工作。像掃描電子顯微鏡(掃描電鏡),在材料分析、醫藥、化學等研究領域,都必不可少,而這類器械也可定位為再製造實驗室設備。
  • 都是氧氣,工業氧氣和醫用氧氣有什麼不同?
    提起氧氣想必大家都不陌生,氧氣不就是我們每天呼吸的氣體嗎。可是你知道嗎,氧氣也是分等級的,不同濃度的氧氣有著不同的用途,這些氧氣能廣泛應用於工業、醫療業等等。今天我們就來講講工業氧氣與醫用氧氣。
  • 李博:破解航空工業領域關鍵難題
    「航空工業是高新技術學科與尖端工業製造相結合的國家戰略性產業,是典型的技術密集型和知識密集型產業,涉及工業製造的各個領域。我們的目標就是聚焦關鍵技術,解決航空工業領域關鍵難題,為祖國的航空事業貢獻科技力量!」
  • 西北工業大學群智感知前沿領域研究位居世界第一
    目前,基於該平臺,西工大已與西安市相關部門開展城市精細化管理、公共安全等領域的應用探索。以期能大規模提高城市和社會治理的效率和質量,降低人工維護成本。讓未來的城市生活更加高效便捷如何了解城市交通路網的暢通和擁堵情況,並對車流和人群進行引導?如何低成本、高效率地獲知遍布城市的公共設施出現了損壞?如果發生了安全事故或者突發事件,該如何取證?
  • Science:有調查有真相!某些AI領域多年無實際進展
    具體到技術層面,論文對比分析的AI建模方法包括:神經網絡剪枝、神經網絡推薦算法、深度度量學習、對抗性訓練、語言模型。科研有風險,入坑需謹慎。下面,AI科技評論簡要介紹這幾篇論文,為大家提供避坑指南。通過測試集反饋進行訓練:不僅是度量學習領域,大多數論文都有這一通病:將數據集一半拆分為測試集,一半拆分為訓練集,不設驗證集。在具體訓練的過程中,定期檢查模型的測試集精度,並報告最佳測試集精度,也就是說模型選擇和超參數調優是通過來自測試集的直接反饋來完成的,這顯然會有過擬合的風險。
  • 攜手中國,以科研實力打造儲能技術領域新格局
    由伍倫貢大學傑出教授Zaiping Guo和多位博士學者領導的新型儲能技術科研項目再次傳來好消息,憑藉強勁實力入駐澳大利亞的頂尖工業轉型研究中心。  在此次合作中,伍倫貢大學攜手多所高校,以科技力量持續有力地推動儲能科技領域發展,為解決全球能源危機積極尋找解決方案。
  • 工業內窺鏡的應用領域有哪些?
    工業內窺鏡操作簡單,可與監視器或顯示器連接,實時顯示檢測圖像,且堅固耐用。那麼工業內窺鏡的應用領域有哪些呢?:可用於核電站、火電站、水電站的鍋爐、熱交換管路、冷凝器管路和汽輪機、發電機轉子、中心孔、聯箱、渦輪機、管道、冷凝器管、泵、鍋爐、熱交換器,閥門、壓力容器等的重要設備以及其他設備,進行缺陷探測和狀態監測。
  • 多孔碳酸鈣都有哪些高端應用領域?
    正是因為多孔材料具備了這些特性,使得它們在許多工業領域有廣泛應用。多孔碳酸鈣是一種無毒且生物相容性良好的材料,具有良好的生物降解性,而且降解速率適宜,使得該材料能夠在藥物、電子、陶瓷等諸多領域得以廣泛利用。    1、藥物載體    藥物載體是靶向給藥的重要組成部分,尤其在一些重大疾病治療方面(如癌症、高血糖等)顯得特別受關注。
  • 刷新三觀的科研領域,而且在這個領域的研究,中國領先全球
    美國在其空軍網站上發文稱:美空軍的量子計劃應申請中國技術的援助與支持,美國的量子研究領域已跟不上中國的步伐。頂尖科學家們最終都會發出一個疑問:這個世界的真相是什麼?愛因斯坦的相對論似乎揭示了世界的真相:這個世界是有規律的,是物質決定意識的。
  • AlphaGo贏了柯潔一局,下一個被AI入侵的領域會是什麼?
    AI已經滲透到工業、商業和人們生活的方方面面。2000年,高盛在紐約總部的美國現金股票交易櫃檯僱傭了600名交易員。但今天,這裡只剩下兩名交易員「留守空房」。瑞銀也沒有落後,這是8年前瑞銀集團的交易大廳:
  • 2018年,機器學習和人工智慧領域最重要的突破是什麼?
    2018年,人工智慧發展到什麼階段了?Quora鼎鼎有名的大V認為,AI炒作和AI威脅論在今年都降溫,並且不會有AI寒冬,升溫的是各種開源框架,2019年的AI,你認為會是怎樣? 2018年,機器學習和人工智慧領域最重要的突破是什麼? (這裡給你留出充分思考的時間。)
  • 盤點船舶領域不可不了解的科研院所
    【能源人都在看,點擊右上角加'關注'】一、七院簡介:1961年,海軍組建艦艇研究院並正式成立國防部第七研究院(簡稱七院),七院屬國防部建制,在國防科委領導下進行工作,其黨政工作和日常工作的組織領導由海軍負責。1965年轉隸第六機械工業部。
  • 短波紅外應用領域大揭秘—工業領域
    上期我們講解了短波紅外成像在安防領域的應用,本期講解工業領域當中的短波紅外應用 矽片檢測因此人眼或可見光晶片,只能接收表面反射光,無法對材料內部缺陷進行檢測。通過紅外相機,則可做Si材料的內部缺陷檢測。
  • 機器有了綜合感官?新研究結合視覺和聽覺進行情感預測
    AI Scholar Weekly是AI領域的學術專欄,致力於為你帶來最新潮、最全面、最深度的AI學術概覽,一網打盡每周AI學術的前沿資訊。 每周更新,做AI科研,每周從這一篇開始就夠啦!
  • AI防癌地圖不斷展開 醫學科研發展的速度也越來越快
    有資深業內人士曾表示,投機者「走一步看一步」,有理想的創業者「走一步看百步」。相比於很多醫療公司終日困惑的商業化問題,素有「AI四小龍」之稱的依圖醫療希望在AI+醫療賽道上實現「異道超車」。依圖醫療副總裁方驄博士表示,依圖醫療則側重智能醫療與診斷的領域,且產業化才是推動智能醫療健康發展的根本。
  • 金剛石單晶領域取得重大科研突破
    金剛石單晶領域取得重大科研突破 來源:科技日報時間:2021-01-11 10:25:51 如何讓金剛石「聽話」,
  • 氣體傳感器在不同領域中分為哪三類使用?
    打開APP 氣體傳感器在不同領域中分為哪三類使用? 工程師黃明星 發表於 2018-07-17 08:21:00 目前無論是工業、商業、公共環境,都會用到不同工作原理的氣體傳感器。而根據應用領域,環境監測類氣體傳感器一般主要可分為以下三類。
  • 現在ai突破基礎研究平臺的難度還有點大
    醫療行業的人工智慧肯定是基於人工智慧大數據的深度學習和仿真模擬實驗,來形成醫學的疾病診斷、治療、康復等系統。可以嘗試企業通過科研平臺基於學術界新的突破性技術,進行開發。用人工智慧技術輔助醫院進行基礎性的病理診斷、口腔診斷、放射診斷等,以及輔助診斷口腔等的輔助性器官和手術。另外,可以嘗試利用人工智慧輔助醫療技術,推廣心臟支架、先天性畸形的治療等疾病預防和治療方案,或者幫助醫生診斷病理。
  • 合肥工業大學在碳纖維復材組合結構領域取得研究進展
    近日,合肥工業大學土木與水利工程學院王靜峰教授課題組在碳纖維復材組合結構領域取得研究進展,其論文Performance and design of partially CFRP-jacketed circular CFT column under eccentric compression發表在國際期刊Journal of Constructional Steel Research上,並被國際著名工程學科技網站