談起國內AI開源開放生態,為何這些大咖都在討論飛槳

2020-12-09 機器之心Pro

AI 技術需要開源、開放,對於這一點,產學研各界已經達成了共識,政府也在全力支持國內開源生態的建設。

長期以來,開源開放的研究氛圍一直是促進人工智慧領域發展的關鍵因素。正是因為學界和業界參與者不斷和快速地公開自己的研究結果和代碼,人們才能夠及時掌握相關方向的最新進展,並在學術環境之外開展自己的研究。

在百度與中國科協學會學術部共同主辦的 2020 中關村論壇——AI 開源創新與產業智能化平行論壇上,開源、開放再次成為了中心話題。在這次論壇中,中國工程院院士、浪潮首席科學家王恩東,百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰,百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜,小米集團副總裁、小米集團技術委員會主席崔寶秋,天津飛騰信息技術有限公司副總經理張志群等十餘位產學研各界頂級專家帶來了AI 開源生態構建、產業智能發展趨勢以及自主核心 AI 技術應用價值成果的深度分享。

在談到開源創新為何如此重要時,王海峰表示,人工智慧高速發展,已成為新一輪科技革命和產業變革的重要驅動力量。這其中,人工智慧技術的開源創新起到了很大的作用。一方面,開源創新可以加速技術的創新發展,不斷拓展人類認知邊界和技術邊界;另一方面,所有開發者都可以基於開源開放的成果開發自己的項目、產品及業務,更便捷、高效、安全地推進技術創新與應用。

百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰在論壇中致辭。

2012 年,AlexNet 的成功吸引了學術界和工業界對於深度學習的廣泛關注。如今,深度學習已經成為 AI 研究的主流方法。在這場產業智能化升級之戰中,深度學習自然也成了「商家必爭之技」。然而,深度學習應用的高門檻也讓很多企業望而卻步,很多工作都是在「重複造輪子」,創新無從談起。

作為「智能時代的作業系統」,開源深度學習平臺的出現徹底改變了這一現狀。

開源開放的深度學習平臺有效地降低了深度學習技術應用門檻。作為百度自主研發、國內最早開源開放、功能完備的產業級深度學習平臺,飛槳一直備受矚目,而且已經大規模應用於通信、電力、城市管理、工業、農業、林業等眾多關乎國計民生的領域,加速推動千行萬業實現智能化。

在這次論壇中,吳甜做了主題為「飛槳推動產業智能化之路」的演講,系統介紹了開源開放的飛槳在產業智能化升級大潮中所扮演的重要角色。

百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜在論壇中演講。

長期致力於小米技術研究與應用的崔寶秋也在本次論壇上分享了他的觀點《智能新時代 擁抱開源》。他指出,雲計算與大數據時代離不開開源,AI時代更是與開源相互促進。

小米集團技術委員會主席崔寶秋在論壇中演講。

飛騰公司副總經理張志群發表了題為《飛騰芯算力 智能新引擎》的演講。他表示,新基建帶來了萬億級市場,也為產業智能化升級帶來許多機會,更給信息產業提出了算力、協同、安全、應用這四大考驗。其中,自主可信、內生安全,是新基建的運行保障;開放聯合、應用創新,是新基建的落地關鍵。

天津飛騰信息技術有限公司副總經理張志群在論壇中演講。

國內首個開源開放的產業級深度學習平臺——百度飛槳

飛槳是百度自主研發,國內首個開源開放、技術領先、功能完備的產業級深度學習平臺,2016 年正式開源。

在深度學習模型開發、訓練、預測和部署等方面,飛槳已可比肩 TensorFlow、PyTorch 等國際主流框架,並在多項技術上有優於後者的表現,打破了國內的 AI 開發者過度依賴國外開源深度學習框架的局限,有助於進一步培育自主可控的 AI 產業生態。

在論壇中,吳甜介紹說,飛槳目前有四個方面的領先技術:開發便捷的產業級核心框架、支持超大規模深度學習模型訓練、多端多平臺部署的高性能推理引擎以及覆蓋多領域的工業級模型庫。

最近,飛槳又迎來全新升級。從技術層面出發,此次更新可形容為「動靜統一、軟硬融合」。在硬體上,飛槳目前已適配 22 種晶片型號,覆蓋 15 家硬體廠商,對國產硬體的支持超過 TensorFlow 和 PyTorch;軟體上,動態圖功能升級實現了動靜態的結合,讓用戶更容易開發模型;全面升級的 API 體系,則對於開發者更加友好。目前,飛槳可以與華為等硬體進行深度配合,讓 AI 應用收穫更強勁的效果,加速人工智慧技術的進一步普及。

如今,飛槳已經應用到金融、工業、城市治理等多個領域。

在金融風控領域,使用飛槳可以將信貸風險判斷準確率提升 21%,飛槳中的語義理解模型 ERNIE 通過學習大量的文本和知識實現了語義理解性能的大幅提升。

在計算機視覺領域,飛槳已經開始助力工業質檢,比如筆記本外殼檢測、總裝車燈檢測,幫助工廠在大面積的產品或小部件中找出微小的瑕疵。

在智慧城市中,飛槳可以應用於城市治理、施工車輛追蹤,車輛違章監測等場景。

飛槳的成功秘訣:開源

和 AI 領域的其他技術一樣,飛槳的成功,自然也離不開開源。

作為開源軟體,飛槳一直在建設開源社區。目前,飛槳已經凝聚了 230 萬開發者,創造了 31 萬個模型,項目數量總體超過 4.7 萬,並且有多個項目登頂各大榜單。飛槳推出的飛槳開發者 PPDE 計劃也共建了開源社區,組建了 22 個飛槳地方社群,100 多個高校社群。

開源給飛槳的開發所帶來的益處良多。

首先,開源的環境對平臺的開發提出了更高的要求。開源以後,社區裡的開發者非常多,工程師把代碼亮出來以後,大家都能知道你是如何設計的,以及你的代碼、文檔有沒有問題。這就對整個編程的易用性、API 的完備性提出了新的要求,這些要求以前在不做開源時不會考慮太多。

其次,開源是幫助構建生態的良好方式。深度學習框架的上下遊生態非常複雜,需要和晶片、計算機系統做對接。在飛槳開源的生態系統中,第三方生態貢獻扮演了很重要的角色。在飛槳這個項目中,很多的開發不是百度工程師做的,還有其他人在基於這個做出新的項目和更多的貢獻。

在論壇中,王海峰表示,百度十年以前開始全面布局人工智慧的時候,就是本著開源、開放的精神。早在 2012 年,百度就開放了翻譯的 API。如今,百度翻譯每天的翻譯量已經達到了 1000 億字符。2013 年,百度又開放了語音平臺,現在每天的調用量超過 150 億。

2016 年,在開源飛槳的同時,百度也開放了百度大腦的很多 AI 能力。發展到今天,百度大腦每天的調用量超過 1 萬億,很多開發者都在使用這些工具推動自己的業務。

與此同時,企業對於開源的擁抱程度也是在持續增加的。

一方面,企業自身所開發的軟體平臺、工具正在進行越來越多的開源工作,有 95% 的受訪者認為企業開源是至關重要的。另一方面,企業在使用開源軟體的時候,預期也在一直在發生變化,77% 的受訪者表示他們希望增加對企業開源軟體的使用。這些都說明,開源社區是在持續發展的,這反過來又會促進飛槳等開源平臺的發展。

核心問題:如何建好生態?

在主題演講之後,百度深度學習技術平臺部高級總監馬豔軍主持了一場圍繞「AI 開源創新賦能產業發展」話題的高峰對話。工商銀行大數據人工智慧實驗室副總經理黃炳、中國聯通研究院人工智慧總監廖軍、中車研究院智能產品負責人田寅、Gartner(高德納)研究諮詢高級總監張桐、百度 AI 技術生態部總經理劉倩等嘉賓展開深度的行業交流。

田寅表示,開源工具在傳統企業發揮著非常重要的作用,它們可以幫大家更快地上手深度學習,更快地領悟到新技術。廖軍認為,這種好處其實是雙向的,在開源工具賦能傳統行業的同時,後者其實也充當著貢獻者,在用的過程中發現問題,幫助開發者打磨這些工具,雙方一起建設一個完善的生態。

在整個論壇中,「生態」都是一個高頻詞,開源本身就是要建立一個生態體系。那麼,如何建好這個生態體系,找到利益互通的點,避免惡性的競爭是一個值得思考的問題。

張桐認為,在數據方面,我們需要用聯邦學習等技術解決數據孤島問題,讓數據真正為我所用;在算力方面,要建立一種共享機制,幫助中小企業用上 AI。

對於數據孤島問題,黃炳補充說,其實行業裡面關於聯邦學習的產品不是沒有,而是過多。因此眼下的問題其實是聯邦學習缺乏規範性。他認為,要讓中小企業用上 AI,核心其實是搭建平臺,把中小企業接觸 AI 的門檻降下來。

眾嘉賓表示,目前業界開源生態與環境正在隨著 AI 大規模落地的進展快速構建。在業務實踐中,類似飛槳這樣成熟可靠,已被大量產業級應用驗證的開源平臺,不僅為技術開發和企業創新不斷降低著門檻,更為整個產業智能化升級不斷加速。

「AI 開源創新賦能產業發展」 高峰對話。

對於百度做開源的核心思路,百度 AI 技術生態部總經理劉倩解釋說:「做開源開放的時候,我們有一個非常明確的判斷,就是人工智慧最後的產業級應用一定不是由某一家企業來主導完成的,最後一定會形成一個角色分明、上下遊的這樣一個產業級的生態。所以從那個時候開始,我們去分享開源平臺,去做百度大腦開放平臺,其實都是在做最底層的基礎設施,希望能夠給各行各業提供從數據、算法、工具到平臺的支持。」

在對話現場,Gartner 還發布了最新調研報告《飛槳推動中國產業智能化之路》,從深度學習趨勢判斷方面著重分享了飛槳在推動中國產業智能之路中形成的自我定位、技術優勢、技術布局以及生態布局等。

Gartner 報告下載連結:https://www.gartner.com/technology/media-products/pdf.jsp?g=Baidu-1-242L3UMH-CHS

開源開放,是人工智慧發展的重要趨勢之一。研究和發展技術領先、功能完備、自主可控的核心技術對於推動我國技術創新、產業發展和人才培養等都具有至關重要的作用。本次「AI 開源創新與產業智能化」平行論壇不僅展示了產業級深度學習開源平臺在人工智慧領域帶來的創新和賦能,更展示了中國 AI 系統建設與生態發展的速度與新思路。

參考連結:

https://baijiahao.baidu.com/s?id=1674870214107274652&wfr=spider&for=pc

https://m.gmw.cn/baijia/2020-09/17/34197260.html

相關焦點

  • WAVE SUMMIT+2020深度學習開發者峰會召開,飛槳開源生態繁榮成勢
    百度飛槳作為國內開源最早、技術領先、功能完備的產業級深度學習平臺,繼520峰會之後,持續發布前沿產業洞察,重磅技術升級和開源生態成果。眾多行業專家、知名學者、開源領袖出席峰會,共同探討產業共進、人才共育以及開源共建,多重舉措推動國家AI技術發展,助力產業智能化升級。「開源開放已經成為驅動技術創新和加速產業發展的核心動能。」
  • 走在開源最前端的百度,正在用百度飛槳、Apollo、ECharts們改變世界
    ,將國內開源的「終極理想」往前又推進了一步。(飛槳在 GitHub收穫了超過47000個Star)作為我國首個開源開放、功能完備的產業級深度學習平臺,飛槳能夠做到這樣的地位,當然少不了要有自己獨特的優勢。總的來說,飛槳有以下 4 大領先技術。
  • 結識AI大咖與深度學習進階,還有DJ、樂隊
    因為這裡有:王海峰、黃鐵軍、王蘊紅、文繼榮、朱軍、李宏毅等你熟知的大咖暢聊產業、人才與開源5 大主題、30 場技術公開課由大廠資深工程師傾情講授DJ、樂隊、街舞、脫口秀同臺 AI 狂歡夜這是由深度學習技術及應用國家工程實驗室與百度聯合主辦的
  • 百度飛槳推出開源框架V2.0RC版本,帶來「編程一致、動靜統一」全新...
    百度飛槳作為國內開源最早、技術領先、功能完備的產業級深度學習平臺,繼520峰會之後,持續發布前沿產業洞察,重磅技術升級和開源生態成果。眾多行業專家、知名學者、開源領袖出席峰會,共同探討產業共進、人才共育以及開源共建,多重舉措推動國家AI技術發展,助力產業智能化升級。「開源開放已經成為驅動技術創新和加速產業發展的核心動能。」
  • 如何做好「AI大生產平臺」?百度飛槳全景圖曝光 升級35項功能
    【TechWeb】5月20日消息,作為國內最早開源開放的深度學習平臺,百度「飛槳」已經凝聚了194 萬開發者,服務8.4萬家企業,創造了23.3萬模型,成為國內服務開發者規模最大、功能最完備的開源開放深度學習平臺。作為百度「AI大生產平臺」的基礎底座,飛槳的每一次能力升級總都吸引廣大人工智慧開發者的目光。
  • 百度CTO王海峰:開源開放是驅動技術創新和產業發展的核心動能
    百度飛槳作為國內開源最早、技術領先、功能完備的產業級深度學習平臺,繼520峰會之後,持續發布前沿產業洞察,重磅技術升級和開源生態成果。眾多行業專家、知名學者、開源領袖出席峰會,共同探討產業共進、人才共育以及開源共建,多重舉措推動國家AI技術發展,助力產業智能化升級。「開源開放已經成為驅動技術創新和加速產業發展的核心動能。」
  • 百度飛槳為AI獨立發展提供保障
    新一代人工智慧技術的發展,離不開晶片與深度學習框架兩大基礎。隨著中國科研創新能力的提升,技術領域取得大量突破。自2016年百度飛槳深度學習框架率先開源後,陸續有企業、高校等也開源了各自研發的深度學習框架。飛槳等平臺在技術上已取得突破與領先,但在市場佔有率、生態成熟度等方面仍有提升空間。
  • 2020啟智開發者大會開幕 百度飛槳正式發布「OpenI-星辰PPSIG共建...
    大會以「啟智築夢 開源先行」為主題,立足於國際國內開源大環境和發展趨勢。開源領域頂尖專家學者和企業領軍人物共聚一堂,探討開源開放呈現出的新形勢、新格局、新機遇。百度飛槳全面參與,並承辦深度學習專場,展現了飛槳的最新技術進展及成果。
  • 百度飛槳全新發布「大航海」計劃,5億資源重磅加碼高校人才培養
    百度飛槳作為國內開源最早、技術領先、功能完備的產業級深度學習平臺,繼520峰會之後,持續發布前沿產業洞察,重磅技術升級和開源生態成果。眾多行業專家、知名學者、開源領袖出席峰會,共同探討產業共進、人才共育以及開源共建,多重舉措推動國家AI技術發展,助力產業智能化升級。 "開源開放是驅動技術創新和加速產業發展的核心動能。"
  • 「OpenI/O 2020啟智開發者大會」共話開源 百度飛槳引領行業發展
    大會以「啟智築夢 開源先行」為主題,立足於國際國內開源大環境和發展趨勢。開源領域頂尖專家學者和企業領軍人物共聚一堂,探討開源開放呈現出的新形勢、新格局、新機遇。百度飛槳全面參與,並承辦深度學習專場,展現了飛槳的最新技術進展及成果。
  • 百度飛槳全景圖上新,重磅發布PaddleHelix螺旋槳生物計算平臺
    百度飛槳作為國內開源最早、技術領先、功能完備的產業級深度學習平臺,繼520峰會之後,持續發布前沿產業洞察,重磅技術升級和開源生態成果。眾多行業專家、知名學者、開源領袖出席峰會,共同探討產業共進、人才共育以及開源共建,多重舉措推動國家AI技術發展,助力產業智能化升級。「開源開放已經成為驅動技術創新和加速產業發展的核心動能。」
  • 百度飛槳被贊是「自主研發的範本」
    其中在9月18日,百度與中國科協學會學術部共同主辦的「AI開源創新與產業智能化」平行論壇上,十餘位產學研各界頂級專家共話AI開源生態構建以及自主核心AI技術應用價值成果。自主研發的AI技術再次成為行業專家的關注焦點。  實際上,這種聚焦正是對當下現狀的回應。
  • 年度最有意思的AI開發者活動來了!
    因為這裡有:王海峰、黃鐵軍、王蘊紅、文繼榮、朱軍、李宏毅等你熟知的大咖暢聊產業、人才與開源5 大主題、30 場技術公開課由大廠資深工程師傾情講授DJ、樂隊、街舞、脫口秀同臺 AI 狂歡夜同時,百度還將帶來飛槳最新的升級發布,作為集深度學習核心訓練和推理框架、基礎模型庫、端到端開發套件和豐富的工具組件於一體的功能完備、開源開放的產業級深度學習平臺,飛槳的最新升級必將會給開發者和企業發展注入新的動力。
  • 飛槳開源框架2.0四大亮點搶先看:全新升級的API體系,成熟完備的...
    5月20日的「WAVE SUMMIT」峰會上,飛槳開源框架發布了1.8版本。如今飛槳即將進入了2.0時代。飛槳2.0的四大創新帶來體驗變革,助力 AI 產業應用和科研創新再次升級!1.在飛槳開源框架2.0中,都被封裝成了高層 API ,開發者只需10行代碼就可以編寫完成訓練部分的程序。最為重要的是,與它框架相比,飛槳高層 API 和基礎 API 並不是相互獨立的兩個體系,二者完全可以靈活地交叉使用,這一特點稱為「高低融合」。
  • 百度飛槳口罩人臉檢測與識別模型再升級,視頻教學帶你實戰
    自百度開源業界首個口罩人臉檢測及分類模型之後,開發者社區進行了充分討論並提出了該模型存在的一些問題和不足。在本文中,百度飛槳官方對這些反饋積極回應,同時提出四大升級方案,為開發者一一解惑。在技術討論群裡,廣大開發者針對口罩人臉檢測與分類模型的技術應用展開了充分的討論,有些開發者實戰反饋,模型在實際場景下還是有一些提升空間。
  • 百度CTO王海峰:開源開放是驅動技術創新和加速產業發展的核心動能
    深度學習的發展就是一個例證,大量的科技成果都基於開源深度學習框架研發,通過開原始碼的方式共享成果,而這一過程也進一步加快了深度學習及相關領域的技術創新發展。更令人欣慰的是,有很多科研成果都來自中國的科研人員以及技術開發者,中國開源力量正在影響全球的科技創新。開源開放也正在加速產業創新發展。
  • 微軟收購 GitHub 兩年後,大咖共論開源新生態
    還加入開源專利聯盟 OIN(Open Invention Network),同意向所有其他 OIN 成員開放其所有專利。如今,微軟在 GitHub 擁有 3800 個開源項目,成為世界上最大的開源項目支持者。微軟鼓勵員工投入開源事業,成立自由和開放原始碼軟體基金會(FOSS Fund),為參與開源的員工提供10,000美元的贊助獎。
  • 最新Gartner調研報告發布 2020中關村論壇揭示飛槳推動產業智能化...
    9月18日,2020中關村論壇「AI開源創新與產業智能化」平行論壇於中關村國家自主創新示範區展示中心重磅開幕。此次論壇由中國科協學會學術部與百度共同主辦,聚焦國內自研開源核心技術賦能產業級創新的重要趨勢與標杆,深入探討AI開源生態構建,產業智能化趨勢以及自主核心AI技術應用價值成果,備受各界關注。
  • 飛槳框架高層API,輕鬆玩轉AI
    針對不同的使用場景,飛槳框架提供了不同高層 API,從而降低開發難度,讓每個人都能輕鬆上手深度學習。我們先通過一個深度學習中經典的手寫數字分類任務,來簡單了解飛槳高層 API。然後再詳細的介紹每個模塊中所包含的 API。
  • 百度飛槳又有大動作!推出圖神經網絡屠榜「必殺技」UniMP
    但是,這個領域一直缺乏規模比較大且認可度較高的數據集。目前大量的論文仍然在Cora、PubMed、Citeseer等小數據集上進行實驗,實驗的效果也沒有普適性。但是單純考慮標籤傳遞或者節點特徵都是不足夠的。