百度AI,走過2019

2021-01-10 百度

還有八天,我們就要和2019年說再見。

今天,我們用這篇文章,從技術突破與生態繁榮、應用落地與產業升級、服務社會與人才培養三個維度,梳理了百度 AI 的2019年。文章有些長,但每一句話都凝鍊了百度 AI 和產業各界大量的時間和努力。

以 AI 為核心的「第四次工業革命」大幕,已經徐徐拉開。2020年,百度會更有 AI !

回顧2019年,無論是百度 AI 的同學們,還是中國產學研各界,都開始以前所未有的認真和篤定討論著「第四次工業革命」。2019年,我們提出,人工智慧進入工業大生產階段。作為新一輪科技革命和產業革命的核心驅動力量,人工智慧與前三次工業革命的核心技術一樣,具有很強的通用性,呈現出標準化、自動化和模塊化的工業大生產特徵。2019年,我們探索了 AI 進入工業大生產的真實路徑,推動 AI 邁入自動化、標準化和模塊化的新階段,並與百度業務以及各行各業的生產實踐深入結合,加速產業智能化進程。2019年,新技術、新業態、新形勢風起雲湧,人工智慧與實體經濟的交融愈加深刻。在這樣關鍵的變革時期,百度 AI 堅持走自己的路,深入研究,紮實應用:核心技術創新突破,國際舞臺屢奪桂冠;建設軟硬一體 AI 大生產平臺,全面自主可控、開源開放;數據、算法和算力有機融合,依託百度智能雲,賦能各行各業智能化升級;培養 AI 人才,踐行 AI 服務社會。2019年,百度 AI 前行的每一步,走得穩健而篤定。我想,或許可以用三句話來描述2019百度 AI 人的成果與努力:我們打造了紮實的底座;推動了真實的改變;創造了值得信賴的未來。——百度 CTO 王海峰

回顧百度 AI 在2019年中所經歷的風景和收穫,我們想從三個方面說起:

首先,百度大腦的算法、算力取得突破,成為「軟硬一體 AI 大生產平臺」,實現 AI 技術的標準化、自動化、模塊化,成為智能經濟的基礎設施。

其次,AI 技術在這一年中更好地賦能了百度業務體系,支撐百度業務高質量成長;我們也將 AI 技術與平臺能力,通過百度智能雲「雲+AI」的「高速公路」輸送到了千行萬業,助力產業智能化。

同時,我們推動 AI 倫理建設,以 AI 技術服務社會,讓生活更美好。希望有 AI 的前方,更加溫暖而明亮。

在這篇文章中,讓我們逐個進入2019年百度 AI 的風景。

2019年,中國人工智慧專利申請量排名中,百度以5712件位列第一,並包攬了深度學習技術、語音識別、自然語言處理、智能駕駛等多個人工智慧核心領域第一;2019年,百度大腦全面升級為5.0,成為支撐產業智能化、軟硬體一體的 AI 大生產平臺。

在算法突破和計算架構升級的基礎上,百度大腦5.0進行算法、計算架構與應用場景的融合創新,打通人工智慧產業化應用落地的全部流程,實現了 AI 技術的標準化、自動化和模塊化。由此,企業和開發者不用重複「造輪子」,能夠直接將 AI 技術應用於行業場景,加速產業智能化進程。

百度大腦研發最頂尖的 AI 技術,用百倍的努力獲取在技術上進一步的突破。基於領先的算力、數據和百度飛槳深度學習平臺,百度大腦的語音、視覺、自然語言處理、知識圖譜等 AI 核心技術持續創新,世界領先。

1. SMLTA 模型大幅提升語音識別準確率和速度

語音識別方面,百度提出流式多級的截斷注意力模型 SMLTA,在國際上首次實現流式注意力建模超越整句注意力模型的性能,也是國際上首次實現在線語音識別大規模使用注意力模型。

SMLTA 在大幅提升識別速度的同時,也提高了識別準確率。輸入法有效產品相對準確率提升15%,音箱有效產品相對準確率提升20%。

流式多級的截斷注意力模型 SMLTA

2. 僅需20句話就可合成專屬聲音

語音合成方面,針對風格遷移、音色模擬和情感擬人的三大挑戰,百度推出語音合成技術 Meitron,將聲音中的音色、風格、情感等要素映射到不同的子空間,在使用時,不同要素任意組合,靈活控制合成語音的風格。

Meitron 個性化語音合成降低了技術門檻,僅需20句話就可以製作一個人的專屬聲音。該技術成果已經落地百度地圖,百度地圖發布了「百雀靈計劃」,上線全球首個地圖語音定製功能。

Meitron 個性化韻律遷移合成技術

3. 特色視覺技術矩陣,囊括多項賽事冠軍

視覺技術方面,百度已經形成了包括圖像、視頻、AR/VR、重要垂類、軟硬一體化五大方向的特色視覺技術矩陣。

OCR、物體檢測、視頻理解、目標跟蹤等業界領先的圖像與視頻技術多次在國內外頂級賽事中取得佳績,例如在 CVPR 2019 就取得10項冠軍,並已在機械製造、金融、醫療、教育等領域得到廣泛應用。

創新的 3D 和 AR 視頻交互技術,已經實現人臉、手勢、環境、肢體多維度的技術突破,可用於一體化人機互動等創新應用。

4. ERNIE 榮登 NLP 領域權威數據集 GLUE 榜首

自然語言處理技術方面,百度打造了可持續學習的知識增強語義理解框架 ERNIE,通過建模海量數據中的實體、概念等先驗知識,學習真實世界的語義關係。融合知識的語義建模大幅增強模型的語義表示能力,在共計 16 個中英文任務上超越 BERT、XLNET,取得 SOTA 效果。

2019年12月,ERNIE 在自然語言處理領域權威數據集 GLUE 中榮登榜首,並以9個任務平均得分首次突破90大關刷新該榜單歷史,超越微軟 MT-DNN-SMART、谷歌T5、ALBERT 等一眾國際頂級預訓練模型。

ERNIE 已經在工業級應用,如閱讀理解、情感分析、搜索智能問答、視頻推薦、CTR 預估等廣泛使用,效果提升非常明顯。

(ERNIE 在自然語言處理領域權威數據集 GLUE 中榮登榜首)

5. 對話技術突破,提升口語理解能力

對話方面,百度提出了基於深度注意網絡的多輪響應選擇匹配模型 DAM(Deep Attention Matching Network),顯著提高了口語理解能力。

在對話系統框架中,百度一方面提供可編程的對話管理框架,並內置多個常用標準對話範式,為在雲端開發靈活可變的業務對話邏輯提供便利;另一方面,提供需求分發和全局記憶機制,支持多個對話任務的集成與聯動,提高了對話技能的可復用性,降低了新業務的重複開發成本。

百度可定製對話技術依託百度大腦 UNIT 平臺,支持5萬多個對話技能,服務廣大行業客戶。

6. AI 計算架構升級,提供百萬 TOPS 的算力

人工智慧算法能力快速提升,對算力的要求也越來越高。面對即將到來的 AI+5G 時代,計算將無處不在。

百度大腦全新的 AI 計算架構,通過晶片、連接、系統和調度的協同設計和技術創新,提供百萬 TOPS 的強大算力。與此同時,晶片之間、系統之間、設備之間的互相連接,將不同場景中的計算連接在一起,產生更大的計算力。

7. 打造 AI 控制、低 PUE 的雲計算中心

百度在建的雲計算中心將擁有超大型神經網絡、超大規模高性能計算集群,其基礎設施技術架構世界領先,是數據中心領域首個供電、製冷全分布式預製化數據中心。

基於百度飛槳研發的 AI 控制系統,設計年均 PUE 1.15,基礎設施能耗降低70%,每個可用區每年節電超過2億度,相當於10萬戶居民一年的用電量。

百度打造智能經濟時代的新型基礎設施步伐正在加快,支持百度 AI 發揮更大的創新能力和社會經濟價值。

百度陽泉智能雲計算中心

8. 百度崑崙雲伺服器上線

2019年12月,基於百度自主研發的中國首款雲端全功能 AI 晶片「崑崙」的雲伺服器正式上線,百度崑崙雲伺服器為企業和開發者們提供超強的 AI 推理和訓練性能,加速 AI 技術與各行各業深度融合的步伐。

百度崑崙雲伺服器在150瓦功耗下能帶來260萬億次定數的 AI 運算,提供 512GB/s 的內存帶寬;提供完整的開發工具鏈,支持用戶使用 C/C++開發算子,具有很好的可編程性;提供一套圖編譯框架 XTCL,能夠支持百度飛槳、TensorFlow 和 Pytorch 等主流深度學習框架;支持語音、圖像 NLP 等不同的算法模型,其中 ERNIE 模型的性能是 T4 GPU 的三倍以上。

9. 百度鴻鵠晶片量產,專為遠場語音交互打造

今年7月,百度發布了專為遠場語音交互打造的百度鴻鵠晶片。

鴻鵠晶片的設計,變革傳統晶片設計方法,遵循「軟體定義晶片」的全新設計思路。

該晶片採用雙核 HiFi4 架構,2.8M 大內存,臺積電 40nm 工藝,在此硬體規格上,100mW 左右平均工作功耗,即可支持遠場語音交互核心的陣列信號處理和語音喚醒能力,將為車載語音交互,以及智能家居等場景帶來更大想像力。鴻鵠晶片流片的同時,即實現了量產。

10. 「量脈」實現量子軟硬體連接

量子計算被認為是未來計算技術的心臟。

2018年百度成立量子計算研究所,開展量子計算軟體和信息技術應用業務研究,致力於量子信息科學中量子技術的研發和儲備,重點關注量子架構、量子算法、以及量子人工智慧應用。

2019年,我們研發出國際領先、國內第一的雲上量子脈衝系統「量脈」,可將量子計算軟體指令(邏輯門)轉換成控制量子硬體的脈衝序列,算法性能較同類工具實現成倍的提升,是實現量子軟硬體連接的關鍵橋梁。

11. AI 與 5G 相互賦能,計算無處不在

5G 網絡與 AI 技術結合將為各行各業帶來新的互聯互通機遇。AI 賦能 5G,使 5G 更加智能;5G 賦能 AI,讓 AI 無處不在。

百度一方面在基礎設施和基礎技術層面發力,比如針對延時,我們通過不同的通信技術,如 MEC 計算節點、WiFi Node 等,去實現更好的通信;另一方面我們也在聯合運營商、硬體廠商、產業界,合力推動 AI+5G 在自動駕駛、物聯網、在線翻譯、搜索、地圖和 8K 網際網路視頻直播等方面的應用。

12. 打造完整 AI 安全體系,推動 AI 安全生態建設

百度大腦打造了完整的 AI 安全體系,從基礎的開源技術矩陣、開放行業解決方案的平臺,到與學術界、企業、政府、機構等多層面的開放協作,技術產品覆蓋雲管端以及大數據和算法層面的一系列安全風險問題,為 AI 技術的產業應用保駕護航,推動了 AI 時代的安全生態建設,讓全行業享受到更安全的 AI 創新變革。

2019年,百度安全憑藉其在物聯網設備的數據傳輸、接入、控制等安全性保障方面作出的成績和行業領先的技術實力,將「2018中國十大最有影響力物聯網安全企業獎」收入囊中。

在算法和算力獲得突破後,我們總是在第一時間將各種 AI 前沿技術應用到實際場景中,去檢驗前沿技術的效力,同時也以應用數據和成果反哺前沿技術研究,不斷調整方向,使得技術能更好地服務於產業。

1. 全雙工免喚醒讓對話更自然

人工智慧正在創造全新的人機互動。

小度助手5.0的對話能力迎來重大技術革新——全球領先的全雙工免喚醒能力,實現了「一次喚醒,多輪交互」免喚醒詞連續對話。

當用戶與他人對話時,小度知道什麼時候是在跟她說話,什麼時候該應答、執行任務,什麼時候只需聽著、不搭話、不反應。她在交互體驗上給人的感受就像一個既「聽話」又「懂事」的孩子。

(李彥宏現場演示小度音箱的全雙工免喚醒技術)

2. 機器翻譯技術突破,實現高準確、低時延的端到端同傳系統

機器翻譯領域,我們相繼提出了多任務學習、多智能體聯合訓練等前沿方法,並在2019年國際權威 WMT 評測中取得中英翻譯第一。

機器同聲傳譯方面百度走在領域前沿,提出了首個具有預測和可控時延的同傳模型,首個語義單元驅動的上下文同傳模型,並研發了業內首個語音到語音的同傳系統,為用戶提供高質量、低時延的同傳體驗。

3. 國內唯一的城市道路 L4 級視覺感知解決方案

感知系統作為自動駕駛最為關鍵的環節,其技術發展的程度直接關係到自動駕駛的有無以及後續發展。

今年在 CVPR 2019,百度 Apollo 公開了國內唯一的純視覺 L4 級自動駕駛解決方案——百度 Apollo Lite,能夠支持對10路攝像頭、200幀/秒數據量的並行處理,單視覺鏈路最高丟幀率能夠控制在5‰以下,實現全方位360°實時環境感知,前向障礙物的穩定檢測視距達到240米。

相比旋轉式雷射雷達感知方案,視覺感知方案價格低廉且便於獲得,為企業、開發者們提供了一個低價、優質的自動駕駛解決方案。

(L4 級自動駕駛純視覺城市道路閉環解決方案——百度 Apollo Lite)

4. 增強現實的自動駕駛仿真系統研製成功

我們以計算機視覺和 AR 技術研發了一種增強現實的自動駕駛仿真系統(AADS),使用雷射雷達(LiDAR)和相機掃描街景。根據獲得的軌跡數據,為汽車和行人生成了看似合理的交通流,並將其合成到背景中。合成圖像也可以基於不同視角和傳感器模型(相機或 LiDAR)進行再合成。生成的逼真圖像添加了完整注釋,可用於從感知到規劃的自動駕駛系統訓練和測試。

該系統相較於現有仿真系統,在真實感、擴展性等方面都實現了突破性的技術進展。論文發表於《科學》雜誌《機器人學》子刊。

5. 合成虛擬形象在多個場景應用

百度合成虛擬形象技術結合多模態識別與理解、面部、肢體和嘴型生成、GAN、TTS 等技術,實現了業界首個可以量產視頻的真人形象虛擬主播,在多個場景應用:

央視與百度合作打造AI 虛擬主持人小靈,亮相央視2019五四晚會;澎湃新聞與百度合作打造了第一個真人形象的虛擬主播早晚新聞欄目;浦發銀行與百度合作打造了業內首個「金融數字人」,有顏值,有情感,有專業的銀行知識,提升銀行客服體驗。

百度智能雲「浦發數字人」

6. 基於知識圖譜,視頻語義理解能力大幅提升

知識能幫助 AI 更深度地理解真實世界。

百度推出了基於知識圖譜的視頻語義理解能力,通過對視頻的視覺、語音、文本的多模態知識解析,在多元異構知識圖譜上建立關聯,並通過計算推理,建立對視頻的深度語義理解,大幅度提升視頻理解效果,目前已在百度視頻搜索、推薦、內容生成等多個產品上線。

7. 能說會道的機械臂「茶博士」

基於服務機器人方案,我們打造了機械臂「茶博士」,利用百度 3D 視覺技術,機器人可以對茶杯的位置進行檢測和追蹤。通過機器人運動規劃和控制,機械臂可以對工作空間進行碰撞檢測,避開障礙物。完成實時規劃運動後,可自動生成倒茶軌跡。語音語義聯動技術解析,更是讓機器人像「人」一般,聽得懂,說得好,做得準。

百度從布局 AI 開始,就一直堅持開放的戰略。以 AI 技術為核心的「第四次工業革命」需要全產業的參與。

百度作為人工智慧平臺型公司,研發全球領先的 AI 技術的同時,通過百度大腦 AI 開放平臺、飛槳產業級深度學習開源開放平臺、Apollo 自動駕駛開放平臺、小度開放平臺以及各類開源框架和數據集等,向廣大開發者和企業用戶開放 AI 能力,提供技術和解決方案,賦能各行各業轉型升級。

1. 中國服務規模最大的 AI 開放平臺

自2016年以來,百度至今已經開放了228項領先 AI 能力,開發者數量超過150萬,日均調用量突破1萬億次,語音、人臉、NLP、OCR 調用量中國第一,是業內最全面、最領先、服務規模最大的 AI 開放平臺。

百度大腦開放平臺已經在語音、視覺、語言等方面實現全面升級,具備深度學習框架、場景化 AI 能力、定製化訓練平臺到軟硬一體模組和解決方案等,可以為不同 AI 技術積累和場景需求的開發者提供助力,解決實際問題。

2. 飛槳產業級深度學習開源開放平臺

飛槳是以深度學習框架為核心的深度學習平臺,下接晶片,上承各種應用,是「智能時代的作業系統」。據 IDC 報告顯示,百度飛槳與谷歌、Facebook 名列前三,領銜中國深度學習平臺市場,也是市場份額前五中唯一的國貨。

從2012年起,百度開始研究和應用深度學習,打造了國內唯一開源開放、功能完備的深度學習平臺飛槳。不斷升級、持續完善的飛槳平臺,向標準化、自動化和模塊化發展,滿足開發者和產業越來越多、越來越複雜的需求。

飛槳平臺核心技術領先,具備開發便捷的產業級深度學習框架、超大規模深度學習模型訓練技術、多端多平臺部署的高性能推理引擎、開源開放覆蓋多領域的產業級模型庫四大領先技術。

在全球科技競爭日益加劇的當下,我們越發明白,掌握自主可控的深度學習技術有助於我們贏得大國 AI 科技博弈。華為麒麟晶片與百度飛槳深度合作,打通深度學習框架與晶片 AI 算力,強強聯合創造中國 AI 核心競爭力。百度飛槳既在世界開源精神中汲取養分並積極貢獻,也在自身的土壤裡成長出茁壯根系。

飛槳產業級深度學習開源開放平臺全景圖

3. Apollo 自動駕駛開放平臺

2017年11月,我們發布了全球首個自動駕駛開源項目——Apollo 自動駕駛開放平臺。

截至目前,百度 Apollo 平臺已經匯聚了全球177家生態合作夥伴;在全球,有97個國家超過3.6萬名開發者使用 Apollo 開原始碼,開原始碼數量超過56萬,Apollo 自動駕駛平臺已成為全球最強大、最開放、最活躍的自動駕駛平臺。

4. 小度技能開放平臺

過去一年中,小度技能開放平臺(DuerOS 技能開放平臺)上的技能開發者數量已經超過3.7萬人,小度技能開放平臺可提供包括遊戲、效率工具、網絡電臺、直播、兒童教育、智能家居等3500多種技能支持。

品牌合作生態上,小度助手的合作夥伴數量已經超過500家,與華為、OPPO、vivo、創維、TCL、索尼、小天才等多領域頭部品牌建立了多個層級的合作。小度助手可以控制的 IoT 智能家居設備已經超過了7000萬。

5. 中國首個開源的邊緣計算框架 BAETYL

隨著 5G、物聯網、人工智慧等信息技術的融合發展,邊緣計算正在發揮更大的作用。

在2019年 Open Networking Summit Europe 大會上,百度智能雲宣布將百度智能邊緣計算框架 BAETYL 捐贈給社區,BAETYL 成為中國首個開源的邊緣計算框架。

BAETYL 和百度智能邊緣 BIE(Baidu IntelliEdge)雲端管理套件配合使用可以達到雲端配置、邊緣運行的效果,滿足各種邊緣計算場景的需求。

6. 自研底層區塊鏈技術開源,告別「拿來主義」

中國已明確要將區塊鏈作為核心技術自主創新的重要突破口。但是目前,中國自主技術平臺不多,超過80%的區塊鏈技術平臺是使用國外開源技術(如 Fabric、以太坊)的產品或者衍生產品。

2019年5月,百度首次對外發布區塊鏈品牌——Xuper,並宣布這項國人自研的底層區塊鏈技術 XuperChain 正式開源,與開發者共享科技創新成果,告別技術上的「拿來主義」和核心技術依賴別國帶來的風險。

7、工業級開放數據集,促進算法研究

大規模領域數據集是機器學習研究和應用的基礎。

百度 BROAD——Baidu Research Open-Access Dataset 項目發布了多個工業級的領域數據集,如大規模自動駕駛數據集、街景圖像數據和文字場景數據集、視頻精彩片段、場景解析、機器閱讀理解、中文句子及相應的開放域信息提取事實數據集、中文信息抽取數據集、中文短文本實體標註數據集、中英同傳數據集、青光眼圖像數據集、年齡相關性黃斑變性圖像數據集、病理性近視等,促進算法研究,推動 AI 發展。

其中,大規模自動駕駛數據集 ApolloScape 是首個來自大型自動駕駛公司的大規模開放數據集,是行業內環境最複雜、標註最精準的三維自動駕駛公開數據集之一,自2018年3月發布以來,已經在全球範圍內被下載上萬次。

(ApolloScape 數據集示例:彩色圖像(上部)及其二位語義標籤(下部))

在 AI 基礎技術全面升級之後,落地應用成為大家最關心的問題。在智能經濟新趨勢下,產業智能化是新的潮流。

2019年百度 AI 的產業智能化基於百度大腦 AI 大生產平臺,一方面支撐百度業務高質量成長;另一方面通過百度 AI to B 承載者百度智能雲的「雲+AI」能力,為各行各業大規模輸送百度的 AI 技術成果與平臺能力。

百度在移動網際網路的布局全面加速,已經打造了戰略級入口百度 APP +「搜索+信息流」雙引擎+「百家號+小程序」雙生態的完整體系。其中每一個環節,AI 技術都大幅度增強了產品體驗,讓用戶在應用百度移動產品時獲得高效、準確、智能化的體驗。

我們的搜索首條滿足率不斷提升,2019年第三季度由上一季度的51%提升到56%,更能理解用戶搜索需求,提供更直觀、準確的信息、知識和服務。

百度 APP 多輪語音對話問答和真人聊天幾乎無區別,點開相機圖標就能自動識別超過1000萬種物品,30+種場景識別,還能實現找同款、比價格、跳轉到電商平臺購買等功能。

此外,截至2019年11月,AI 加持的智能小程序月活躍用戶達到3億。

2019年,百度地圖 AI 功能創新連連進擊:推出了全球首個地圖語音定製功能,讓全民都可擁有專屬語音包,實現 AI 普惠;智能語音助手用戶量在十一當天衝破3億,更多人出行習慣於「動口不動手」,語音用戶量穩居行業第一,是名副其實的 AI 地圖領軍者。

作為百度 AI 技術的絕佳落地場景,百度地圖在功能創新、技術突破和生態賦能上持續發力,實現出行智能化。

功能創新方面,業內首創的智能語音、智能定位、精準規劃、ETA(通行時間智能預估)等,讓我們成為用戶最可靠最信賴的出行伴侶;在技術創新方面,深度融合 AI 技術讓數據採集自動化程度提高到80%,引入 VPAS 技術再現圓明園大水法遺址,更真實復刻現實世界。

目前,百度地圖日均位置服務請求次數突破1200億次,日均軌跡裡程20億公裡,註冊開發者數量達180萬,服務超過50萬個移動應用,已成為中國最大的智能化位置服務平臺。

百度地圖還打造了「AI+智能旅遊」的全球生態格局,推出了以 AI 技術為核心的「1+3」智能旅遊產品矩陣,即「一張服務覆蓋全球的地圖+AR 導覽、小度 AI 導遊、VR 全景虛擬遊三大能力」,藉助領先技術升級用戶全鏈路旅遊體驗。

截至目前,百度地圖小度 AI 導遊已服務超1億用戶,覆蓋2000家景區,境外 POI 覆蓋率超過98%,是中國唯一一家服務覆蓋全球的地圖產品。

2019年初,百度輸入法發布 AI 探索版,憑藉全語音交互的創造性產品形態,以及搭載其中的凌空手寫、圖像分割等領先的 AI 功能,正式進入「全感官輸入」2.0時代。

依託百度強大的 AI 能力,百度輸入法在語音、智能預測、圖像等人工智慧領域多點開花。

語音方面,最新的流式截斷的多層注意力模型(SMLTA)已經上線部署到語音輸入法全線產品,這是首個基於流式注意力的語音識別線上服務,在線語音相對準確率領先行業最高水平15%,離線語音識別準確率持平在線識別水平;此外還達成了業內首家實現高精準中英文混合語音輸入和方言免切換語音輸入的巨大成就。

在智能預測和圖像領域百度輸入法同樣取得了驕人成績。2019年百度輸入法接連推出了 NLP 整句預測、AI 鬥圖、神句配圖等 AI 落地功能,且是業內首家實現多場景整句智能預測的輸入法產品,這些功能均受到了用戶的廣泛好評。

截至日前,百度輸入法日均語音請求量峰值已突破8.6億次,日活躍用戶數4.53億。根據艾媒等多家權威機構行業報告顯示,百度輸入法份額超過40%,領跑行業。

百度輸入法 AI 探索版

2019年,小度助手和小度智能音箱均取得可喜成績:

軟體方面,截至6月搭載小度助手的智能設備激活數量已突破4億臺,小度助手語音交互超過36億次。

硬體方面,據第三方機構數據表明,第二季度小度系列智能音箱出貨量位居全球第二、國內第一,同比增長率高達3700%。前三季度,小度有屏音箱出貨量穩居全球第一。

作為百度人工智慧軟硬體一體化戰略的重要載體,小度在技術能力、應用落地和生態建設上持續發力,致力於打造無處不在的人工智慧個人助手。

技術創新方面,小度助手發布5.0,擁有行業領先的全雙工免喚醒能力,以及全球首創的家庭信息流和家庭通訊通知能力。小度智能音箱的產品體驗一直處於行業領先的地位。

2019年12月,中科院物聯網研究發展中心發布的《智能音箱的智能技術解析及其成熟度測評》報告顯示,小度智能音箱在聽清率、聽懂率和滿足率三個緯度上全面領先,成為智能音箱領域的「全能冠軍」。

應用落地方面,小度助手(DuerOS)被視為智能家居時代的新入口和樞紐。小度助手的對話能力應用到智能家居、智能穿戴、車載、移動等多個場景,為用戶帶來「動口不動手」的智能生活體驗。

12月12日,小度在家智能屏 X8正式發布,通過對「AI 智能交互」、「AI 智能理解」、「 內容服務新生態」三要素的詮釋和定義,再次引領行業發展方向,全面進入「智能屏」的智能生活新時代。

百度 Apollo 不僅以自動駕駛硬核技術領跑全國,在自動駕駛商業化落地的賽程中也成果斐然。

百度 Apollo 深耕自動駕駛技術,取得多項領先成果。6月19日,百度 Apollo 公開了自動駕駛純視覺城市道路閉環解決方案——百度 Apollo Lite,這是目前國內唯一的城市道路 L4 級視覺感知解決方案。

截至目前,百度 L4 級別自動駕駛城市道路測試裡程已經突破300萬公裡,已在23個城市進行測試,智能駕駛專利1237項,位列全國第一。

此外,百度自動駕駛路測牌照總數達到150張,佔中國全部獲批自動駕駛路測牌照一半以上。

隨著年初 Apollo Enterprise(企業版)重磅發布,Apollo 正式開啟了商業化元年。目前,小度車載 OS 已攜手頭部生態合作夥伴300餘家,與60多家汽車品牌建立了商業合作,未來將有超過500款車型陸續面世。

值得一提的是,百度自動駕駛計程車隊 Robotaxi 已經在長沙開啟試運營,首批45輛 Apollo 與一汽紅旗聯合研發的「紅旗 EV」Robotaxi 車隊在長沙部分已開放測試路段開始試運營,這標誌著 Apollo Robotaxi 從內部研發逐步走入市場。

(百度自動駕駛計程車隊 Robotaxi 在長沙正式開啟試運營)

Apollo 智能交通業務先後落地多個城市:

百度 Apollo攜手重慶合作「西部自動駕駛開放測試基地項目」,加速重慶汽車產業及城市交通管理的技術迭代和產業升級;攜手紹興共同打造中國首條以自動駕駛車路協同創新示範為特色的智慧快速路;與滄州政府共同努力,促成中國首個區級全域自動駕駛可載人測試路網正式開放,百度 Apollo 自動駕駛車隊在滄州正式啟動測試;此外,百度智能交通信控系統幫助保定交通延誤時間減少20%-30%。

2019年,兩度戰略升級的百度智能雲取得不俗成績:憑藉穩健的服務和過硬的技術,助力百度 APP扛住了史上最大流量春晚紅包的衝擊;用戶數翻了一番,收入增長2倍,流量及伺服器同比增長3倍;在國內雲廠商中,單季度營收突破10億用時最短,穩居中國公有雲市場第一陣營。

作為百度 AI to B 的重要承載者和輸出者,百度智能雲在技術能力、應用落地和生態建設上不斷努力,以 AI 工業化促進產業智能化進程。

技術方面,百度智能雲取得了一系列進展:

發布完全自主研發的「百度崑崙雲伺服器」,讓中國最好的 AI 跑在自主可控的 AI 晶片上;發布中國首款智能邊緣計算產品 BIE;在全球首次實現 5G+8K+AI 視頻直播;發布「天鏈」區塊鏈平臺,提供一站式的「ABC+區塊鏈」可信解決方案。在保持技術能力領先的同時,百度智能雲持續降低 AI 應用開發門檻。

應用落地方面,百度智能雲在網際網路、金融、智能城市、工業製造等行業已經擁有標杆性落地案例:

與中國聯通打造的智能客服已經在中國聯通三省一基地上線;聯合浦發銀行推出首個「金融數字人」,升級銀行客服體驗;與央視網共建人工智慧研發中心,打造媒體行業的 AI 軟硬體產品;與精研科技打造智能質檢車間,提升製造業質檢效率,降低用工成本;與東軟集團合作推出「雲智未來城市」新型智慧城市整體解決方案,實現城市智能規劃、智能建設、智能治理與智能服務等;與銀聯商務聯手打造金融級雲服務,賦能800萬商戶「上雲」。

精研科技智能質檢車間

AI 相關的倫理、安全以及社會責任,一直是百度 AI 前行的指引和方向。

我們始終相信:

安全可控是 AI 的最高原則;促進人類更平等地獲取技術和能力是 AI 的創新願景;教人學習,讓人成長,而非超越人、替代人,才是 AI 的存在價值;為人類帶來更多自由與可能,是 AI 的終極理想。

此時此刻,向我們身邊看去,可以發現我們生活中、生產中、社會中的無數角落正在因百度 AI 技術而變得更加美好。

在「百度 AI 尋人」平臺,用戶發起照片比對接近40萬次,9000多個走失者與家庭重新團聚。

百度 APP 全面上線「百度 AI 垃圾分類」智能小程序,基於百度 AI 視覺和語音能力,通過語音搜索或識圖搜索,就可以幫助用戶方便快捷地對垃圾進行分類。

通過學習權威教材、指南及三甲醫院優質病歷,基於醫學知識圖譜、醫學自然語言處理等 AI 技術,嚴格遵循醫學循證規律,我們開發了臨床輔助決策系統(CDSS),已經覆蓋全國16個省市,服務近百家大型醫院和近千家基層醫療機構、上萬名醫生。

我們發布了百度聽障兒童無障礙閱讀計劃,推出了全球首款聽障兒童 AI 手語翻譯小程序,能將繪本文字翻譯為手語,幫助聽障兒童實現無障礙閱讀。

百度地圖上線了全國首個與政府機構合作、覆蓋多個城市的母嬰室位置信息查詢產品——母嬰室地圖,用戶可在百度地圖中一次性查找周邊甚至全程的母嬰室,並直接導航前往。

我們還將 AI 應用在了颱風路徑查詢、瀕危土家語保護、AI 改造盲人按摩院等方面,在無數我們想得到和想不到的場景裡,讓 AI 變成時代洪流裡一個個讓人欣慰的笑容。

培養一位 AI 人才就像是為 AI 發展之路點燃了一盞燈。百度在 AI 人才培養方面已經形成了囊括師資培訓、學生賽事、課程共建以及教材出版等多個維度產學融合生態。

通過「全國高校深度學習師資培訓班」、「飛槳博士會」、「AI 快車道」、「黃埔學院」、「在線深度學習集訓營」等項目,百度培養了1000名專業教師,助力200+高校開設深度學習課程,為近1000家企業提供技術和應用培訓。

硬體方面,百度上線 AI Studio 教育版,這背後是價值超過千萬人民幣的上千張 GPU 卡,作為師資培訓配套「教具」,免費提供給高校使用。

對於人工智慧的生力軍——學生,百度「以賽代練」,全年舉辦多場大型國內外頂級人工智慧相關賽事。

如已持續15年為中國工程師隊伍輸送人才的百度之星大賽、百度&西安交大大數據競賽暨 IKCEST 首屆「一帶一路」國際大數據競賽、中國高校計算機大賽-人工智慧創意賽等,培養挖掘人工智慧人才、大數據人才,三大賽事覆蓋學子上百萬,近萬支高校隊伍組織參賽,選手來自16個國家,覆蓋亞洲、美洲、歐洲。

從實效來看,百度已經在校企協同、共建 AI 教育體系上領先了一步。長遠來看,這對於整個中國 AI 人才的梯隊建設,也大有助益。

百度自誕生起就是一家科技公司,二十年來一直走在科技創新的前沿,目前全公司科研人員佔比高達61%,全球領先。

2019年,在諸如 CVPR、ICCV、NeurIPS、MRQA 等全球公認的 Top 級賽事及學術頂級會上,百度 AI 斬獲冠軍23次,論文收錄200多篇,彰顯 AI 強國實力。

同時,百度還獲得了來自政府、行業協會、媒體等多方機構頒發的30多個獎項,例如:2019世界網際網路大會領先科技成果、中國電子學會科學技術獎科技進步獎一等獎、最佳人工智慧交互系統平臺、年度網際網路最佳公益平臺等。

二十年的技術積澱,近十年的 AI 布局,讓百度 AI 前進的步伐越走越穩,也越來越快速敏捷。

以 AI 技術為核心驅動力的第四次工業革命的大幕正在拉開,在2019年短短一年的時間裡,百度 AI 的核心技術取得諸多突破,開放生態愈加繁榮,各行各業產業智能化加速,讓 AI 滲透到社會生活的方方面面和千行萬業。

畢竟,在「第四次工業革命」的前夜,沒有人喜歡慢慢等待的感覺。

AI 走進工業大生產,有來自各行各業真切的應用需求,也有我們不負國家不負人民的情懷和夢想。2020,讓我們守望 AI 的瓜果飄香時。

相關焦點

  • 2019百度之星開發者大賽參賽「全攻略」發布
    2019百度之星開發者大賽自7月1日啟動以來,已收到近1800支隊伍報名參賽。本次大賽以輕量級目標檢測為賽題,選手需找出所給圖像中所有感興趣的目標,確定它們的位置和大小,同時使用飛槳模型輸出所給圖片中每個目標的信息,最終榜單排名前10的隊伍進入決賽。今天,我們梳理了選手最關心的11個問題,覆蓋報名參賽、基線、評測腳本和PaddleSlim使用教程。
  • 吳恩達離職百度後要去Drive ai?其妻子否認這種猜測
    【TechWeb報導】3月28日消息,百度首席科學家吳恩達宣布離職百度後,對於其下一站的去向引起了眾多的猜測。吳恩達妻子Carol Riley擔任總裁的創業公司Drive ai呼聲最高,但是來自騰訊科技的消息,Reiley對這一猜測明確表示不屬實。
  • 用百度 Doodle 記錄的2019
    在過去的2019年,百度 Doodle 幾乎以每十天「變身」一次的速度,與你一同紀念每一個值得紀念的日子。來看看百度 Doodle 陪你走過的2019吧正是這些孩子用小手印下了2019年兒童節的百度 Doodle,也印下了無窮的想像力和無限的童真。
  • 孵化公司賣給蘋果、百度,艾倫人工智慧研究所到底是啥
    智東西(公眾號:zhidxcom)編 | 董溫淑智東西5月27日消息,今年1月份,蘋果收購了AI圖像識別初創公司Xnor.ai。消息人士稱收購金額為約2億美元(約合人民幣14億元)。2017年的百度開發者大會上,百度高調宣布全資收購自然語言處理公司Kitt.ai。
  • 億元免費算力 | 百度大腦AI Studio重磅推出算力支持計劃
    「提供總計1億元免費算力,助力開發者成功」——百度大腦AI Studio大數據、大模型、大算力是深度學習發展的必備因素,算力的重要性不言而喻。4月23日,首屆 WAVE SUMMIT 2019深度學習開發者峰會,百度一站式開發平臺 AI Studio 重磅推出算力支持計劃:豪擲1億元免費算力,為普通開發者破除算力桎梏。
  • AI戰「疫」:百度開源業界首個口罩人臉檢測及分類模型
    2019 新冠肺炎疫情爆發,讓人們的出行發生了很大的變化——自 1 月 24 日武漢宣布封城之後,各省市陸續啟動重大突發公共衛生事件一級響應以控制人口流動。很多城市都已規定必須佩戴口罩、測量體溫才能搭乘公共運輸。
  • 百度AI的2020上半年
    全球 AI 專利申請量已超過1萬件,中國第一2019年,中國人工智慧專利申請量排名中,百度以5712件位列第一。百度大腦在賽事接連奪冠,AI 核心技術持續領先2019年,百度大腦全面升級為5.0,成為支撐產業智能化、軟硬體一體的 AI 大生產平臺。
  • 百度AI文本審核功能一步解決附教程
    導讀:使用百度AI內容審核,可以實現實時或定時進行內容的審核,主要可以應用在短網址生成、論壇發帖、論壇回復、網站留言、文章評論等方面。目前網站百度AI開發平臺步驟註冊帳戶、身份認證這兩項就不做演示了。文本內容審核進入百度AI開放平臺,點擊菜單中的「開放能力」,選擇如下:內容審核可以實現什麼?
  • 築造AI抗疫防線,百度開源業內首個口罩人臉檢測及分類模型
    今天,百度宣布免費開源業內首個口罩人臉檢測及分類模型。該模型可以有效檢測在密集人流區域中佩戴和未佩戴口罩的所有人臉,同時判斷該者是否佩戴口罩。廣大開發者和企業廠商可通過免費開源的AI模型,快速完成軟體開發,為打贏疫情阻擊戰貢獻科技力量!
  • 機器學習新聞綜述:2019年AI領域不得不看的6篇文章
    此外,我們還將簡要介紹一些有意思的人工智慧應用程式,幾款2019年發布的遊戲,以及一些機器學習項目的開源數據集資源。NLP:https://lionbridge.ai/articles/natural-language-processing-101/使用GPT2創建完整的文章:https://lionbridge.ai/articles/this-entire-article-was-written-by-an-ai-open-ai-gpt2/
  • 吳恩達站臺的Drive.ai宣布結束在德州自動駕駛服務 業務低迷且成本...
    吳恩達站臺的Drive.ai宣布結束在德州自動駕駛服務 業務低迷且成本高昂  Emma Chou • 2019-03-27 11:26:25 來源:前瞻網 E1003G0
  • 自動駕駛2019年:小敗局和小幸運,開啟下一個黃金十年
    送別 2019 年,我們站在了 21 世紀一個全新 10 年的開端。如果從谷歌啟動無人車項目 Project Chauffeur 算起,人類在自動駕駛的道路上已經走過了第一個 10 年。
  • 盤點2019雲服務市場頂級玩家:亞馬遜微軟稱雄全球,百度領跑AI cloud
    與此同時,百度、華為雲服務在2019年得到迅猛發展,實現彎道超車,並擠進第一陣營。近年來,雲計算呈現高速發展態勢,隨著物聯網部署規模日益擴大,以及人工智慧技術應用至各行各業,進一步激活雲計算市場潛力,無論是IaaS市場,還是IaaS+PaaS市場,還是私有雲、混合雲,使得「雲」無處不在,已成為當前全球重要基礎設施,推動全球各地雲強勁增長。
  • 開啟黃金新10年:2019年全球自動駕駛10大事件
    送別 2019 年,我們站在了 21 世紀一個全新 10 年的開端。如果從谷歌啟動無人車項目 Project Chauffeur 算起,人類在自動駕駛的道路上已經走過了第一個 10 年。5、Apollo Go 的野心全球自動駕駛由 Waymo 領銜,中國的自動駕駛則以百度 Apollo 作為代表。整個 2019 年,百度 Apollo 自動駕駛開放平臺從 3.5 版本進化至 5.5 版本,還在國內多個城市拿到了自動駕駛載人測試牌照。
  • DMV年度報告出爐:百度超Waymo獲第一,接管率是不是自動駕駛...
    從今年的接管報告來看,Waymo 和 Cruise 依然強悍,但百度出人意料地反超Waymo佔據了 2019 年頭把交椅。AutoX 與剛剛拿了豐田大號支票的 Pony.ai 分列第四和第五名。除了百度、AutoX 和 Pony.ai 這幾家中國血統自動駕駛公司,滴滴也第一次出現在報告中,並且來了個開門紅排在第八位。
  • 百度再創中國AI速度 不用寫代碼一站式搞定工業質檢定製AI模型
    柳州源創電噴技術有限公司在校企合作項目下,基於百度EasyDL零門檻AI開發平臺創建了一個閥座智能檢測模型,正確率已達95%以上,實現了使用機器自動化快速高準確率的檢測方式,為公司全年節省超60萬成本。
  • 2019 年 1 月 AI 最佳網文榜單最新出爐!
    2019 年 1 月過去不久,他也整理出了一份一月 AI 最佳網文榜單,並發布在 Medium 網站上。雷鋒網 AI 科技評論編譯如下。歡迎大家前來閱讀 2019 年第一個月份的 AI 最佳網文榜單。我們是巴黎的一家致力於開發敏捷數據(Agile data)的公司。我們本月榜單中的文章主題涵蓋強化學習、自然語言處理、人工智慧立法等。
  • 百度輸入法「AI助聊」黑科技,幫寫、糾錯、預測橫向兼顧
    而就是這個容易被大家忽視的輸入法軟體,百度已經經過數年的更新迭代和升級,百度輸入法不僅提供了多種風格的鍵盤皮膚,也讓簡單的輸入法有了AI技術的影子。當然市面的第三方輸入法,不止百度輸入法一家,但相較於其它兩個行業巨頭搜狗輸入法和訊飛輸入法,百度輸入法依託百度強大的人工智慧優化,全面進行內容生態的布局,通過多次版本的更新,以及有趣且實用的功能,吸引了大量的用戶下載使用。
  • Q2財報:百度AI破繭化蝶?
    財報數據顯示,二季度百度實現營收260.3億元,同比下降1%;歸屬於百度的淨利潤為36億元,同比增長48%。營收表現趨於穩定,淨利潤大幅上漲,經歷過疫情考驗的百度正在快速恢復。百度核心業務明顯復甦相比充滿挑戰的一季度,二季度百度核心業務已經進入了復甦正軌,實現營收189.3億元,環比增長24%。作為營收支柱,核心業務的快速復甦,成為帶動百度整體業務走出陰霾的主要動力。
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    >>查看詳情ai.baidu.com/tech/face/Face-Link-Platform?&hmsr=aibanner&hmpl=8.18 智能招聘方案新增簡歷畫像功能,開放邀測依託百度 TIC 團隊在招聘方向的深耕,同時結合百度自然語言處理、百度文字識別的 AI 能力,提供多項招聘功能。