百度飛槳躍居世界第二、國內第一!看中國AI領頭雁百度的開源進擊之路

2020-12-11 天極網資訊

  【天極網IT新聞頻道】「開源(open source)」這個詞,指軟體原始碼被開放出來,其他用戶可以在其基礎上修改和學習。開源既造就了繁榮的網際網路時代,又成為技術理想主義者的「烏託邦」。在開源的江湖,珠玉在前,後繼四起,但百度從未缺席。

  近日,權威科技媒體通過分析GitHub上的開源項目數據集GitHubArchive,得出2020和2019年度全球深度學習框架排名榜單,其中,百度飛槳PaddlePaddle均力壓谷歌TensorFlow,緊隨Facebook PyTorch之後,其搶眼的數據表現意味著在開發者積極貢獻代碼和項目、社區活躍、代碼迭代速度上一直保持著強勁的競爭力,已經成為了國內第一、世界第二的深度學習開源框架,將國內開源的「終極理想」往前又推進了一步。

  2020/2019年度全球開源深度學習框架活躍度排名榜單

  如果GitHub開發者想要對開源項目貢獻代碼,需發起pull request把自己修改的代碼合入分支主,如果pull request被合入,則表示代碼被採用,成功完成一次開源貢獻。因此,pull request的發起(open)數量是評估開發者積極貢獻代碼、項目和社區活躍最直觀的指標,合入(merged)pull request是評估開源項目的代碼迭代速度的一個極佳的權威性指標。

  該媒體通過分析GitHub開源項目數據集GitHubArchive之中關於pull request的發起和合入數據,獲得了2020和2019年度全球深度學習框架活躍度排名榜單,其中,百度飛槳的open數據由去年的2759次躍升到今年同期的3391次,比現階段暫列第三的谷歌Tensorflow高出1000多次。飛槳的 merged數據由1924次躍升為2428次,力壓暫居第一Pytorch的238次,比第三名Tensorflow高出近1000次,這也意味著「動靜統一、軟硬融合」的飛槳一直在致力於讓深度學習技術的創新與應用更簡單,其提供的AI底層技術也深受開發者歡迎。

  GitHub 標星 47000+ 百度飛槳成為國產開源「流量擔當」

  百度飛槳於2016年9月正式宣布開源,這使得百度成為繼谷歌、Facebook、IBM後第四家將AI技術開源的公司。作為國內AI開源的扛把子,百度飛槳集深度學習核心訓練和推理框架、基礎模型庫、端到端開發套件和豐富的工具組件於一體,並根據本土化特點將開源框架與應用層面做了更好的結合,旨在打造自主可控的人工智慧作業系統,持續賦能廣大開發者,這意味著個人開發者也可以利用飛槳提供的平臺部署自己的深度學習模型。

  經過 4 年的發展,飛槳在 GitHub 上已經有 62 個 Repositories,共收穫 47000+ Star,成為國產開源項目的佼佼者。

  (飛槳在 GitHub收穫了超過47000個Star)

  作為我國首個開源開放、功能完備的產業級深度學習平臺,飛槳能夠做到這樣的地位,當然少不了要有自己獨特的優勢。總的來說,飛槳有以下 4 大領先技術。

  首先,同時支持動態圖和靜態圖的編程,能夠兼顧易用性和效率。飛槳平臺結合了動態圖的易用性和靜態圖的高性能,使開發者可以兼顧兩者的優勢。第二,針對大規模的工業化場景,飛槳提供大規模分布式訓練能力,在真正的工業場景應對自如。飛槳平臺推出了支持萬億規模參數模型的實時更新能力和訓練能力。第三,端到端的部署是應用深度學習的一個非常關鍵的環節,飛槳提供非常完備的支持各種硬體的端到端的部署能力,能夠使得開發者推理、預測的過程足夠順暢。最後,飛槳還有大量在產業實踐當中沉澱出來的模型,並提供官方的支持,能夠保證開發者的應用效果是最佳的、真正可靠的。

  更可貴的是,飛槳並沒有滿足當下國內深度學習領域「流量擔當」地位,仍在持續進行優化升級。在前段時間舉辦的百度世界2020百度大腦分論壇上,飛槳實現了"動靜統一、軟硬融合"的更新:硬體上,飛槳目前已適配22種晶片型號,覆蓋15家硬體廠商,對國產硬體的支持超過TensorFlow和PyTorch;軟體上,動態圖功能升級實現了動靜態的結合,讓用戶更容易開發模型;全面升級的API體系,則對於開發者更加友好。

  2020年9月,百度飛槳深度學習平臺入選了2020服貿會 「科技創新服務示範案例」, 數據顯示,飛槳當前支持140+個產業及開源算法,累計開發者230萬,服務企業9萬家,基於飛槳開源深度學習平臺產生了31萬個模型。在城市、工業、電力、通信等很多關乎國計民生的領域都有飛槳在發揮作用。

  踐行開源開放理念 百度飛槳在多領域助力應用落地

  基於其簡潔、靈活、快速的特性,百度飛槳推動了各個行業的深度學習應用,在液晶顯示屏的檢測、機器人安全巡檢、遙感監測等領域發揮著不可代替的作用。拿液晶顯示屏檢測來說,精測電子應用飛槳開源深度學習框架開發後,基於其分類、檢測、分割等多種功能模塊,對具有缺陷的液晶屏幕檢測的精度上有很大提升。

  (百度飛槳全景圖)

  同時,飛槳還正在利用技術優勢推動各個行業的深度學習應用,在液晶顯示屏的檢測、機器人安全巡檢、遙感監測等領域發揮著不可代替的作用。

  例如在消費類電子領域,OPPO在其多個業務線都上線了基於飛槳構建的大規模分布式推薦系統,覆蓋全球3.5億月活用戶;工業安全領域,通過飛槳研發的輸電線路通道隱患目標圖像與視頻智能檢測系統,實現了輸電線路通道隱患目標的自動化識別和預警;環境保護領域,飛槳支撐的無人機自主飛行+應用管理平臺,可以對森林進行自主巡邏、火情監測、非法入侵、森林樹木砍伐監測等功能……而這些只是百度飛槳深度學習平臺產業實踐的冰山一角。

  (電網智能巡檢方案上線以來已發現多起安全隱患,是飛槳的典型應用之一)

  今年5月,百度發布了Paddle Quantum,這是建立在百度飛槳深度學習平臺之上的開放原始碼的機器學習工具包,它包括量子開發工具集,量子化學庫以及一系列優化工具,可以幫助領域內的科研人員以及開發者在量子計算應用程式中訓練和開發AI,也為相關領域的愛好者開發量子人工智慧的應用提供了強有力的支撐。

  在百度開源理念下,多領域的領先技術被開放出來,越來越多的開發者通過開源技術來構建業務,並且形成了應用繁榮、活力十足的社群。尤其是飛槳深度學習平臺,既幫助開發者實現人工智慧應用的落地,也在不斷的反饋中迭代平臺架構,促進自身技術升級,並更加貼合開發者的實際需求。

  例如,有大學生藉助飛槳,讓人工智慧來為野外攝像裝置拍攝的海量圖片進行篩選和標註,代替人工的繁瑣和低效,大幅節約人力成本。這一產品將在今年年底交付,方便野保工作者輕鬆使用,為滇南地區包括滇金絲猴在內的生物多樣性保護貢獻了很大力量。

  還有大學生藉助飛槳來搭建深度學習模型,通過攝像頭捕捉和識別聾啞人群的手語,再轉化成語音。如此一來,人們可以流暢地與聾啞人交流,改善特殊人群的生存處境。該項目已在AI Studio人工智慧學習與實訓社區開源,以群策群力實現優化和落地。

  在這些案例中,開源的飛槳成為連結開發者之間的「橋梁」,不僅讓每一個人可以實現自己的理想,更可以通過這些公開項目,加速技術的演進與商業、社會議題的解決。社區的廣泛參與,正是飛槳等開源項目的活力體現,在其上構建繁榮的生態,形成足夠強大的產品競爭力。

  構建開源開放生態 百度要打造人人可以實現理想的技術烏託邦

  開源思路,既體現了百度的基因和能力,也表達出其開放的態度,助力更多企業和開發者實現自己的應用落地與業務升級轉型。

  以深度學習框架為例,百度飛槳具備了深度學習核心訓練和推理框架、基礎模型庫、端到端開發套件和豐富的工具組件,讓所有人都可以在平臺上部署自己的深度學習模型,並且具備簡潔、靈活、快速的特性。

  (飛槳深度學習開源開放平臺全景圖)

  另一個典型的領域是自動駕駛。2017年11月,百度發布了全球首個自動駕駛開源項目——Apollo 自動駕駛開放平臺,其自動駕駛軟體可供任何人免費下載及修改使用。這意味著,許多企業都能通過Apollo平臺結合車輛和硬體系統,快速搭建一套屬於自己的完整的自動駕駛系統。

  目前,百度 Apollo 平臺已經匯聚了全球177家生態合作夥伴;在全球,有97個國家超過3.6萬名開發者使用 Apollo 開原始碼,開原始碼數量超過56萬,Apollo 自動駕駛平臺已成為全球最強大、最開放、最活躍的自動駕駛平臺。

  (Apollo已經形成全球最強的自動駕駛生態)

  此外,還有百度ECharts,這是當前流行、最強大的可視化庫之一,它提供了直觀,生動,可交互,可個性化定製的數據可視化圖表。從2013年1.0版本發布至今,為用戶提供了交互、多維度數據分析、數據自由刷選、多圖表聯動、渲染等豐富功能。目前,Apache ECharts (incubating) 在Github中的star數已經超過42k,每周npm下載量超過25萬。

  目前,百度已經構建起了全新的開源開放生態,主導了一千多個開源項目,聚攏了超過一萬名社區貢獻者,獲得超過30萬次GitHub Star(點讚或支持)。從人工智慧基礎底座深度學習平臺,到語音、視覺、自然語言處理、知識圖譜等通用AI能力,再到Apollo、DuerOS、智能小程序等開放平臺,以及智能交通、智能家居、工業農業等場景化應用,百度開源的能力與技術已經在生活中廣泛落地。

  (百度開源開放生態)

  除此之外,百度還深度參與國內外頂級開源基金會和組織。百度既是Apache 基金會、Linux 基金會以及雲原生計算基金會的金牌會員,其旗下Echarts、Doris、Brpc等多個項目已經成為 Apache 基金會孵化項目,Baetyl、IME、EDL等項目入選了Linux,百度BFE更是成為雲原生計算基金會中,第一個來自中國的網絡方向沙箱項目。

  同時,百度也在大力支持中國自主代碼託管平臺建設,以應對複雜國際形勢下帶來的封閉風險。2019年,百度戰略投資了開源中國,這是中國最大的開源技術社區,旗下運營的Gitee代碼託管平臺是全球僅次於GitHub的代碼託管平臺,每日約增加5000名開發者、200家企業客戶、1.7萬代碼倉庫。在國際市場,開源中國已經可以和GitHub掰手腕,為中國開發者提供了自主穩定的保障。

  百度創始人、董事長兼CEO李彥宏在百度世界2020大會上表示,「推動人工智慧紮實滲透,行業要充分利用開源、開放平臺,它在人工智慧發展當中的作用會越來越受到重視。」百度CTO王海峰也認為,「一方面,開源創新可以加速技術的創新發展,不斷拓展人類認知邊界和技術邊界;另一方面,所有開發者都可以基於開源開放的成果開發自己的項目、產品及業務,更便捷、高效、安全地推進技術創新與應用。」

  (百度CTO王海峰在2020中關村論壇闡述AI開源開放價值)

  可見,「開源」兩個字已經深植百度的基因之中。也證明了,開源開放才是實現技術革新與產業演進的最佳途徑。未來也需要更多像百度一樣的企業,致力於開源開放,為企業、行業和廣大開發者,打造共同繁榮的技術烏託邦。

類型:廣告

免責聲明:以上內容為本網站轉自其它媒體,相關信息僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。

相關焦點

  • 百度飛槳秀出最新成績單,產業應用、人才培養、開源生態全面繁榮
    12月20日,由深度學習技術及應用國家工程實驗室與百度聯合主辦的WAVE SUMMIT+2020深度學習開發者峰會在北京舉辦。百度飛槳作為國內開源最早、技術領先、功能完備的產業級深度學習平臺,繼520峰會之後,持續發布前沿產業洞察,重磅技術升級和開源生態成果。
  • 重磅發布開源框架、生物計算平臺螺旋槳,百度飛槳交了年終成績單
    可見飛槳技術與生態發展的步調越來越快。飛槳是一個開源的平臺,既受益於開源,也反過來促進了開源社區的發展。在談到開源開放的重要性時,百度 CTO 王海峰表示,「開源開放對人類社會過去幾百年科學和技術的發展起到非常重要的作用,讓我們可以更快追蹤到最新的技術進展,並將改進意見以及創新思想迅速進行反饋,形成一個正循環,進一步推動科技的創新迭代。
  • 中國AI看百度已是行業共識 百度AI約等於中國AI的底氣
    中國AI看百度已是行業共識 百度AI約等於中國AI的底氣 鄰章 發表於 2020-01-16 09:52:57 在人工智慧這條賽道上,百度的技術實力又一次得到了業界權威的認可,這也讓中國AI看百度的行業共識再度牢固
  • 全國大學生智能汽車競賽創意組全國總決賽落幕 百度飛槳助AI新秀勇敢啟程
    近日,由中國自動化學會主辦,百度承辦的第十五屆全國大學生智能汽車競賽創意組全國總決賽在南京信息工程大學圓滿落幕。在本次比賽中,百度作為國內人工智慧領軍者,提供了目前國內首個開源開放、技術領先、功能完備的產業級深度學習平臺——百度飛槳,幫參賽選手高效、靈活地完成高精度的模型定製,以賽促教,助力培養創新綜合人才。
  • 百度AI的2020
    飛槳凝聚超過265萬開發者,累計 commit 16萬次,開源貢獻者超過5000位,發展飛槳開發者技術專家(PPDE)97位,基於飛槳訓練34萬個模型,服務10萬家企業。在城市、工業、電力、通信等很多關乎國計民生的領域,飛槳都在發揮價值。
  • 百度AI,走過2019
    百度作為人工智慧平臺型公司,研發全球領先的 AI 技術的同時,通過百度大腦 AI 開放平臺、飛槳產業級深度學習開源開放平臺、Apollo 自動駕駛開放平臺、小度開放平臺以及各類開源框架和數據集等,向廣大開發者和企業用戶開放 AI 能力,提供技術和解決方案,賦能各行各業轉型升級。
  • 圍繞百度飛槳首設自主平臺賽道
    基礎層包括算力、數據,以及以飛槳深度學習平臺為核心的算法平臺,感知層包括語音、視覺、增強現實和虛擬實境等技術,認知層包括語言與知識技術,通過AI平臺與生態對外開放,同時百度大腦還擁有縱貫各層完整的AI安全體系。其中,飛槳深度學習平臺作為百度大腦的基礎技術底座處於重要位置。 飛槳是中國首個全面開源開放、自主可控、技術領先功能完備的產業級深度學習平臺。
  • 開啟開源新次元!飛槳PPDE計劃初啼破長空
    如今在項目成熟後,為Vue.js添磚加瓦的人越來越多,尤雨溪也功成身退回到國內,繼續在新的崗位上發光發熱。在開源世界裡,一直都充滿了種種神奇,如Linux、Hadoop、MySQL、Firefox等耳熟能詳的開源產品早已成為人們網絡生活的一部分,而他們背後的締造者也一樣被開發者們銘記。世界不缺舞臺,優秀的演員與舞臺才能實現真正的相互成就。
  • 百度AI進入「光速」質變時刻 硬核技術實力狂攬23項世界冠軍
    ,獲得榜單世界第一的好成績。現階段,百度大腦實現了AI算法、計算架構和應用場景的融合創新,成為「軟硬一體AI大生產平臺」,以飛槳深度學習平臺為基礎底座,以百度智能云為載體,賦能各行各業的智能化升級。僅今年一年,飛槳榮獲多項大獎。在第六屆烏鎮世界網際網路大會上,飛槳榮獲2019「世界網際網路領先科技成果」;在今年8月召開的中國人工智慧·多媒體信息識別技術競賽中,飛槳又斬獲「創新之星」。
  • GTC大會飛槳專家演講實錄:簡單易用的飛槳分布式訓練功能升級
    12月15日-19日,GTC中國大會首次以線上大會的形式與開發者相見,共組織265場技術演講,演講者分別來自百度、阿里、騰訊、字節跳動等眾多知名企業與清華大學、中科院計算所等知名高校。百度飛槳也貢獻了四個主題演講,現在為您帶來飛槳大規模分布式訓練進展與應用的演講實錄。課程連結:https://nvidia.gtcevent.cn/forum/watch?
  • 頂級期刊《Nature》盤點中國AI發展 百度飛槳等核心技術是關鍵
    報導指出,中國人工智慧研究質量越來越高,但在高影響力論文、人才和治理方面仍在追趕美國。如百度飛槳(PaddlePaddle)等核心技術工具及基礎研究是實現人工智慧長期研發目標的關鍵所在。「過去我們津津樂道說中國的人工智慧的論文發表數量、專利申請數量是全球第一,但是今天我們更多的是要看人工智慧整體這個開發框架上我們有多少話語權。」
  • 人工智慧開源成風,百度華為喊你免費學AI
    2016年,百度開源PaddlePaddle,創國內企業ai開源第一,開始從培訓開發者發力普及框架。到2020年,人工智慧企業團體開始開源成風。 清華大學計算機系圖形實驗室創中國學界開源AI框架之先,開源直接對標PyTorch的AI框架計圖(Jittor)。
  • 百度飛槳PaddleCV全景圖曝光 視覺技術能力三方面重磅更新
    【來源:中國青年網】2020年,「新基建」正給中國科技發展帶來新的重大機遇,人工智慧基礎設施面臨全面升級。深度學習框架正是推動產業智能化進階的重要基礎設施。近日,國內唯一開源開放、功能完備的深度學習開源平臺——百度飛槳,在智能視覺領域實現重大升級。 此次,PaddleCV最新全景圖首度曝光。
  • 百度飛槳PGL-UniMP刷新3項任務記錄 登頂圖神經網絡權威榜單OGB
    屠榜背後:飛槳圖學習框架PGL加持    UniMP基於飛槳圖學習框架PGL(Paddle Graph Learning)實現,依託飛槳核心框架以及自研的圖引擎。  飛槳PGL已經在搜索、廣告、信息流、金融風控、貼吧、用戶畫像、智能地圖等場景全面落地,可支持百億巨圖場景。圖學習作為通用人工智慧算法之一,勢必成為這個時代新的基礎設施,賦能各行各業,助燃智能經濟騰飛。  PGL獲得喜人成績,背後離不開強有力的後盾——飛槳。
  • 百度邀你共赴一場2020冬天裡最火熱的AI Party!
    由深度學習技術及應用國家工程實驗室與百度聯合主辦的WAVE SUMMIT+2020深度學習開發者峰會將於12月20日在北京 798 藝術園區 751 罐舉行。WAVE SUMMIT是中國深度學習開發者每年兩次的技術盛會。WAVE SUMMIT+ 2020是今年的第二場。
  • AI技術領跑、23個國際冠軍,2019百度AI如何彰顯核心競爭力
    在 12 月初國家工業信息安全發展研究中心發布的 2019 年度《人工智慧中國專利技術分析報告》中,百度以全年 5712 件的專利申請數量位列第一,這也是百度連續兩年蟬聯第一。在深度學習技術、語音識別、計算機視覺、雲計算、自然語言處理、智能駕駛技術、智慧機器人七個人工智慧核心領域中,百度包攬了四項分榜的第一名。另據世界智慧財產權組織報告顯示,百度在深度學習領域專利申請量位居全球第二。
  • 浪潮與百度在AICC2019大會宣布AI合作共建AIStation與飛槳聯合方案
    8月28日,在 AICC2019人工智慧計算大會上,浪潮與百度宣布達成人工智慧合作,共建AIStation與飛槳聯合方案。浪潮與百度共建AIStation和飛槳聯合方案AIStation是浪潮面向人工智慧企業訓練場景的人工智慧Paas平臺,可實現容器化部署、可視化開發、集中化管理等,為用戶提供極致高性能的AI計算資源,實現高效的計算力支撐、精準的資源管理和調度、敏捷的數據整合及加速、流程化的AI場景及業務整合,有效打通開發環境、計算資源與數據資源
  • 百度飛槳發布「大航海」計劃:5億資源加碼高校人才培養
    ,支持更強大分布式訓練的業界首個通用異構參數伺服器架構,開源算法庫增至200+,飛槳企業版EasyDL智能數據服務升級,飛槳硬體生態路線圖以及攜手全球開發者開啟「大航海」計劃。百度深度學習技術平臺部高級總監馬豔軍帶來飛槳開源深度學習 平臺的全新發布——開源框架V2.0RC版,「編程一致、動靜統一」的全新開發體驗,將讓開發者驚豔。新框架下,飛槳動態功能走向成熟、API進行了全面升級,同時動靜統一的編程體驗將為深度概率編程、量子機器學習等前沿學術研究提供更好的支持。
  • Google AI地標檢索識別競賽雙料獲勝方案|飛槳PaddlePaddle開源
    機器之心發布來源:百度飛槳近日,百度視覺團隊基於飛槳(PaddlePaddle)深度學習平臺,自主研發的地標檢索/識別解決方案,在 Google Landmark Retrieval 2019[1] 和 Google Landmark Recognition 2019[2] 兩個任務中都斬獲第二名
  • 百度AI發布2020年度成績單,我們為你總結了其中15大亮點
    飛槳已凝聚超過265萬開發者,累計commit16萬次,開源貢獻者超過5000位,發展飛槳開發者技術專家(PPDE)97位,基於飛槳訓練34萬個模型,服務10萬家企業。在城市、工業、電力、通信等很多關乎國計民生的領域,飛槳都在發揮價值。在IDC公布的2020年下半年深度學習框架平臺市場份額報告中,百度綜合市場份額位列第二,與位列第一的Google幾乎持平。4.