曉查 發自 凹非寺
量子位 報導 | 公眾號 QbitAI
如果讓你和10年前、20年前的自己進行一場對話,你想說些什麼?
剛剛,百度用AI技術帶我們體驗了一把「穿越」的感覺,面對20年前的自己。
今天「百度世界大會」首次與「央視新聞」合作,總臺央視主持人康輝和百度創始人、董事長兼CEO李彥宏、百度CTO王海峰,「5個人」進行了一次特殊的對話。
明明只有康輝、李彥宏和王海峰三人,為何會變成「5個人」的對話呢?
原來另外的「兩個人」,分別是AI製造的康輝、李彥宏年輕時的自己。
兩位虛擬人根據康輝和李彥宏20年前的形象、記憶和所擁有的知識打造,形象、動作、聲音高度逼近真人。
在這場特殊的對話裡,不僅康輝、李彥宏能和20年前的「小康」、「小李」流暢閒聊,甚至兩個虛擬人之間也來了一場親切互動。
百度說,這是具備認知能力、可機機對話的終端虛擬人。
而這一場對話背後,百度積攢了10年的技術。
驅動「小康」、「小李」兩位虛擬人的,是10年來不斷進化的「百度大腦」。
百度CTO王海峰表示兩位虛擬人整合了視覺、語音、語言與知識等多種模態的AI技術,具備了認知能力。但這還只是百度大腦最新能力的「冰山一角」。
接著,這位百度CTO從聽、說、看,思考等多個層面,展示百度大腦升級到6.0之後的最新進展。
而且王海峰強調,百度大腦的AI能力,正在通過雲和開放平臺輸出給社會各界,支持各行各業智能化升級。此外,還有縱貫百度大腦各層的安全體系,為AI技術及應用保駕護航。
概括起來就是:百度大腦,正在成為AI新型基礎設施。
百度大腦十年進化
「臺上一分鐘,臺下十年功。」
為了讓虛擬人具備語音、視覺、知識等多方技能,作為技術底座的百度大腦「十年磨一劍」,才實現了現場酷炫的虛擬人對話效果。
今年對百度大腦來說意義尤為特殊,因為它真的走過了十年,經歷了AI技術從沉寂到興盛:
2010年,百度大腦開始基礎能力積累,AI布局初具雛形;
2016年,百度大腦1.0正式發布,開源飛槳深度學習框架上線;
2017年,百度大腦2.0形成了完整的技術體系,AI能力全面開放;
2018年,百度大腦3.0發布,核心技術進入多模態深度語義理解階段;
2019年,百度大腦5.0完整升級為軟硬體一體的AI平臺。
那麼,到了第十個年頭,百度大腦成功升級6.0後又帶來了哪些新變化?
過去一年,百度大腦又在AI計算架構、算法、能力上做出了創新和重要升級,已經成為智能時代的「AI新型基礎設施」。
如果說,百度大腦的第一個十年是完成了能力進化和體系構建,那麼下一個十年,百度大腦的目標就是將最先進的AI技術落地化。
過去每一次百度大腦的升級都以技術為關鍵詞,而今年百度著重突出「AI新型基礎設施」,契合國家戰略中的「新基建」,也符合百度2019年產業智能化的落地思路。
所以百度大腦6.0的全新升級,一言以蔽之就是:在完成技術升級的同時,也要在「新基建」中扮演重要角色,讓各行各業快速運用AI技術,加速產業智能化。
百度大腦6.0完整圖景
虛擬人互動,讓我們直觀地看到了百度大腦一個應用,但百度大腦驅動的,不止於此。
本屆大會上亮相的百度無人車、小度音箱、度曉曉,背後的技術支持,都來自百度大腦。
包括我們手機裡安裝的百度輸入法、地圖、搜索,背後也是靠百度大腦的AI技術。
所以,百度大腦是百度技術多年積累和業務實踐的集大成,從硬體到軟體,從技術底層到應用場景無所不包,也是百度技術的原動力。
而且百度還要把它作為整個AI基建時代的動力貢獻出來,並得到了產業界的廣泛響應。
百度大腦6.0—AI新型基礎設施,已開放270多項領先的AI能力,凝聚230萬開發者,企業發布的模型數量超過31萬,是業內最全面、最領先、服務規模最大的 AI 開放平臺,將更敏捷、更高效支撐AI工業大生產,助力產業智能化提速。
今年,百度大腦6.0除了下沉到「新基建」,也有全方位的升級和完善。
無論是在軟硬體維度的「基礎層」,還是在技能維度的「技術層」。
AI晶片百度崑崙
首先,百度大腦6.0交出第一份硬答卷:
啟動了2年的百度「崑崙」晶片項目,完成第一代晶片的量產和交付使用,第二代晶片已經提上日程,預計明年量產。
在當前大環境下,這個量產和交付進展,毫無疑問也是一針強心劑,從產業到整個國家,意義和價值不言自明。
實際上,如此速度,雖然意料之外,但也在情理之中。
百度在AI晶片方面,實際十年前就已經開始探索。早在2010年,百度就已經在用FPGA研發AI架構,2011年就部署上線。
如今,百度崑崙晶片的生態環境已初步建立,支持多款國產處理器,適用於語音、圖像、NLP等多個場景。
百度方面披露,截止到今天,百度崑崙晶片已經和正在部署接近2萬片,向十幾個客戶完成交付。
比如部署在百度搜尋引擎上的百度「崑崙1」晶片,相比英偉達T4 GPU,百度崑崙1的性能在不同模型下有1.5-3倍的提升。
另外,王海峰也在現場表示,百度「崑崙2」晶片已提上日程,這款晶片採用7nm先進的工藝,相對第一代性能提高了3倍,將於明年上半年量產。
AI開源平臺飛槳
談百度大腦,也不得不提最大國產開源深度學習平臺——飛槳。
作為中國首個開源的產業級深度學習平臺,百度飛槳在此次升級中,依然地位頗隆。
飛槳到今年已升級到2.0版。本次升級可以用「動靜統一、軟硬結合」8個字來形容,升級內容包括兩個方面:
動態方面,圖功能升級實現了動靜態的結合,讓用戶更容易開發模型;全面升級的API體系,對開發者更加友好。
而硬體方面,百度稱飛槳與硬體結合,達到了國際領先水平,甚至超過了TensorFlow和PyTorch國外兩大AI框架,可以適配22種晶片型號,覆蓋15家硬體廠商,對國產AI硬體的支持力度業界第一。
開發者擁護方面,也能體現飛槳影響力。
飛槳正在作為AI新基建的重要基礎設施,為產業智能化升級轉型輸出推動力。
當然,這也離不開百度在飛槳生態建設方面的努力。比如百度大腦在多個視頻平臺上推出了深度學習系列精品課程,並出版了配套的入門教材,幫助開發者快速掌握AI技術。
總之,面向國內AI硬體廠商,百度大腦有業界最廣泛的適配方案,面對開發者,也有相關課程培養開發者,這也體現了今年百度大腦作為「AI新型基礎設施」的理念。
結合技能和新進展來看,這種基礎設施的地位及作用,還會更清晰。
知識圖譜
百度大腦6.0的另一大進展,就是建成了世界上規模最大的知識圖譜。
百度的知識圖譜自2012年啟動,經過近10年的發展,已擁有超過50億實體和5500億的事實,每日調用次數超過400億次,覆蓋了100多個行業場景。
最近這一年,百度的知識圖譜技術實現了全面的升級,針對不同的應用場景和知識形態,構建了事件圖譜、多媒體圖譜、行業知識圖譜等多種圖譜。
語義理解框架文心(ERNIE)
還有自然語言理解能力——NLP框架「文心」(ERNIE)——取得進一步提升,尤其在中文語義理解上,文心依舊一馬當先。
新版文心,相比去年在8項NLP任務中,語義理解的準確率相比去年提升了2.07%。
今年,百度還提出了基於多流機制的預訓練語言生成技術——ERNIE-GEN和知識增強跨模態語義理解技術ERNIE-ViL。
ERNIE-ViL首次將場景圖知識融入到跨模態的預訓練模型中,在視覺問答、圖像檢索等5個典型的跨模態任務上取得了SOTA效果,並在跨模態語義理解權威榜單VCR上登頂榜首。
近期發布的文心語義理解平臺,將全面的NLP算法集、端到端的開發集和平臺化服務於一體,提供數據處理、模型訓練、模型評估、模型部署等環節提供一整套工具,一站式幫助企業實現智能化轉型。
視覺語音技術
此外,圖像和語言、語音和語言的一體化理解能力。
在圖像和語音的語言一體化理解方面,百度大腦的OCR識別準確率提升了24%,語音識別準確率和交互成功率大幅提升。
語音識別層面,百度推出端到端信號聲學一體化建模;語音合成層面,則是Meitron和單人千面合成個性化。
目前,百度語音交互技術日均調用量超過155億次,廣泛應用在移動端、智能家居、和語音IoT等場景。
視覺計算方面,百度大腦6.0讓視覺計算走向極致效率,為算法開發者開源Slim系列模型,為業界提供最小的文字、人臉識別等模型。
其他前沿技術
在鞏固基礎的前提下,百度大腦6.0也積極探索與融合前沿技術,將數據聯邦、量子計算等領域納入其中。
百度發布了全國首個面向疫情預測與追蹤的多方位數據協作平臺——百度數據聯邦平臺。
百度還推出了「量易伏」,這是國內首個雲端原生量子計算平臺。
針對開發者,量易伏提供基於Python的開源開放工具包QCompute。
百度還對量子機器學習工具集「量槳」進行了重磅升級:幫助開發者高效地搭建量子神經網絡,上線支持20多個量子比特的量槳模擬器。
最後,百度首次提出AI安全研究的三大維度:Security、Safety和Privacy,即強對抗環境下的安全威脅、非對抗條件下自然環境所產生的真實威脅和數據安全與隱私保護。
從技術大腦到AI基礎設施
毫無疑問,在百度創辦20年之際,這次升級後的百度大腦6.0,已不能用技術大腦視之了。
一方面,它依然是前沿技術邊界探索、最新AI技術輸出的集大成者。
另一方面,它也展現出平臺性、低門檻接入性,以及生產力特性——可以幫助非專業人士快速搭建AI系統,也讓百度大腦成為智能化轉型中的基礎設施。
或者就是百度強調的,AI新型基礎設施。
比如在最新的應用案例中,用百度大腦設計一個智能水運調度應用,非專業技術人員只需不到一天時間,就能完成AI圖像模型的訓練和部署,大大節省了尋找專業機器學習團隊的開發成本。
而這只是「黑科技」觸手可及的案例之一、冰山一角。
為了推動更多人加入進來,百度也放出「狠話」未來5年,還將繼續培養500萬,為中國智能經濟和智能社會的發展提供AI人才保障。
此外,當前形勢下,最值得關注的就是這次在軟硬體方面的自研自主進展。
一方面是晶片,百度崑崙的新進展。
另一方面是作業系統,百度大腦和飛槳這樣的平臺,就是數位化轉型中的智能作業系統。
而百度現在在央視展示的,核心就是四個字:自主可控。
或許作為選項之一,未來可以避免被「卡脖子」。
而且李彥宏也表態,在這種基礎設施的投入上,會堅定不移走下去。
李彥宏表示:
晶片、作業系統這樣過去被「卡脖子」的技術,都是需要長期堅持的,它們的商業價值不可能在短短幾年之內就體現出來,需要我們的科技人員有雄心、有耐心、耐得住寂寞,而且有信仰。我們也有長期的考慮和耐心,希望把中國的這些被「卡脖子」的技術能夠一點一點突破,最後被市場廣泛接受。
但對於這樣的投入,李彥宏認為值得。
或許,這也是百度大腦可以十年發展、十年迭代之後,從一家公司的技術大腦成為整個產業的AI基礎設施的核心原因吧。
— 完 —
本文系網易新聞•網易號特色內容激勵計劃籤約帳號【量子位】原創內容,未經帳號授權,禁止隨意轉載。
原標題:《自研晶片+自主AI框架,百度CTO王海峰攜百度大腦6.0亮相,要做中國「AI新型基礎設施」》
閱讀原文