大數據文摘記者 魏子敏 龍牧雪
「(今年七月份)我確實吃到了一張罰單。」
在2017百度世界大會的現場的開場演講中,李彥宏稱,「無人駕駛車有沒有吃到罰單」是過去四個月被問最多次的問題。「但是如果無人車的罰單已經來了,無人汽車的量產還會遠嗎?」
李彥宏稱將在2018年量產無人駕駛汽車,而除了無人車,百度本次世界大會還重磅發布了第一款智能硬體產品——與渡鴉科技合作推出的智能音箱Raven H。這是百度入局智能家居的重要動作。陸奇稱這是一款能夠帶回家的AI大腦,百度打造自己的硬體產品是建立平臺生態的一部分。
本次百度世界大會定位明確,Bring AI to Life,在硬體和生態上還發布了一系列重要動態:大會的主題是技術創新和產品創新,李彥宏陸奇等相繼登場,介紹了百度AI產品化,以及商業化落地的進程。李彥宏稱百度將在月底發布無需喚醒詞的語音交互產品,陸奇也宣布了DuerOS2.0將發布,手機百度10.0發布。
李彥宏:我們仍然處在AI時代的黎明
按照慣例,開場演講依然由李彥宏給出,李彥宏稱將在2018年量產無人駕駛汽車、百度將在月底發布無需喚醒詞的語音交互產品。大數據文摘記者速記了演講精華如下:
各位上午好,歡迎來到2017百度世界,我們一年一度的百度技術和產品創新大會,今年的差別是推遲到冬天召開了,因為7月份召開了開發者大會,7-11月短短4個月發生了一些改變,我們誕生了不少新的技術和產品。7月份,我想給大家留下最深刻印象的東西,或者我被問最多的問題是:你有沒有吃到罰單。那我今天告訴大家:確實吃到了一張罰單,但是如果無人車的罰單已經來了,無人汽車的量產還會遠嗎?
我們希望更早地生產無人車
從7月到現在,Apollo目前的一些數據:6000多個開發者投票支持apollo,1700多家合作夥伴使用apollo開原始碼,100+合作夥伴申請開放數據。
但是我們並不滿足,我們希望更早的生產無人車,首款無人駕駛小巴車,將於2018年實現量產。
我們的合作夥伴,江淮汽車、北汽都會在2019年生產基於apollo的自動駕駛汽車。大家如果去了奧森,會發現掃地車已經是基於apollo的自動駕駛車自動運行了。
打造一座世界領先的智能出行城市:雄安
而AI除了對汽車,對人類生活方方面面都有影響。
我們目前在跟雄安合作,希望打造一個沒有安檢、擁堵的新的千年大計的城市:一座世界領先的智能出行城市。未來的城市和今天的相比很不一樣。
這些進展都是去年百度世界大會講的一個事情支持的:百度大腦。
從去年到現在,百度已經開放了核心的80+核心AI能力,通過API形式供大家使用。而百度大腦廣泛賦能,日調用次數2188次。
大家可能注意到今天的大會兩邊屏幕有文字上屏,準確率在會場環境下達到95%,英文翻譯也很不錯,到什麼程度呢?如果用大學英語6級翻譯測試題測試,15分的題目可以達到13.6分,已經超過了平均大學生的成績。
電視,從聽話到聰明
人工智慧除了在手機汽車等場景的使用,在家庭裡也有很好的使用。比如電視,很多人都不怎麼使用遙控器,按鈕太多了。但是當電視和人工智慧結合,電視就可以變成聰明的電視。
(VCR)電視裡正在播放戰狼二,出現吳京出場的那一段,可以語音向電視提問:最左邊的男演員是誰?這首背景音樂是什麼?誰作曲?幫我收藏,幫我搜索所有吳京電影,要和戰狼同一題材的。
所以大家可以看到,電視雖然不用學習遙控按鈕,但是它的聰明程度更加符合人類需求,這裡邊當然包含了百度大腦的很多能力:語音識別和視頻搜索。
未來,無喚醒詞,才能成為自然語音交互
我們現在看到很多智能音箱,雖然不需要按住,但是需要一個喚醒詞,一般是四個字,這不符合人與人交互方式,我跟你說話的時候不需要拉你的手,也不需要沒句話都叫你的名字,更不需要每次都叫四個字。
那如何更自然的交互,李彥宏又展示了一個VCR,並預告說,這個月底將發布百度手機語音版本,可以自然的和手機交互。
李彥宏在餐廳環境下邊吃飯邊聽新聞,用語音發出指令「下一條」,「返回」,「聲音大一點」▲
AI讓每個人安全回家
百度apollo疲勞駕駛檢測:在司機使用手機時,車載AI會提醒你不要用手機;檢測到打哈欠,會提醒注意行車安全;檢測到疲勞駕駛,小度為你推薦一首歌曲為你提神;戴上墨鏡,靠紅外檢測依然可以檢測到疲勞駕駛,並且導航到最近的休息區。未來,希望AI不僅僅是導航,而是可以直接將車開到最近的休息區。
我們仍然處在AI時代的黎明,這讓我想起了2006年第一次百度世界大會舉辦的時候,那時候百度的理想或者說使命是「讓人們平等便捷的獲取信息」。12年來,這一點已經很容易實現。今天隨著技術演進,每天都有新的電器工具被發明,但是每次發明一個新的工具,我們都要學習如何使用這個工具,世界正不可避免的日益複雜。但是隨著AI時代的到來,我們相信可以用技術的方式改變這些,讓機器學會聽人的話,讓人的負擔更少,用人工智慧的技術,讓複雜的世界更簡單。
12年前,百度更懂中文。
而今天,百度更懂你。
陸奇介紹百度AI戰略布局
百度COO陸奇接下來登場,他稱今天大會的主題是技術創新和產品創新,我們將介紹AI產品化,加速AI商業化落地,讓AI更快走入人們生活。
「百度是AI公司,百度有最早的投入,最強的技術,最完整的布局:百度大腦、AI技術平臺百度智能雲,讓AI更快產品化。比如apollo,由於生態,其商業化的速度越來越快,2018年後,我們將有多款基於apollo技術的汽車進入量產。」
陸奇稱今天下午也將發布小度車載系統,DuerOS for Apollo帶來一系列強大的能力和體驗。DuerOS可以打造一個全新的新一代的智能電視產品,同時,更重要的是AI把移動網際網路代入了全新的時代,我們叫做新移動時代:手機有更強的感知和計算能力,百度的核心產品,手機百度,愛奇藝等等將更進一步充分利用這一系列能力,引領新一代用戶體驗,特別是手機百度,將把搜索和個性化推薦有機結合起來,打造新一代更懂用戶的體驗。
百度發布第一款智能硬體產品:Raven H-家庭生活中的搜尋引擎
圖:2001太空漫遊裡的超級電腦HAL 9000距離我們依舊遙遠,不過在外形上,不論是天貓精靈還是蘋果HomePod,都似乎在致敬HAL。
硬體的布局通常被視為一種搶佔語音交互入口的行為。國外的廠商如亞馬遜、谷歌、蘋果、索尼,國內的如阿里、京東+科大訊飛、小米甚至喜馬拉雅都在搶佔智能音箱的市場。2015年售出250萬臺、2016年520萬臺,亞馬遜Echo一直是音箱領域的霸主。而谷歌在今年10月初的發布會上,在原有的Google Home之外,發布了兩款智能音箱Google Home Mini和Google Home Max,定位低端和高端消費者,直接對應亞馬遜的Echo Dot和蘋果的HomePod。天貓精靈更是成為了今年雙十一的銷量明星,截至11月11日8時53分,天貓精靈總銷量圖片100萬臺。
百度入局智能硬體的野心傳言已久,本次大會上,百度智能硬體事業部總經理、渡鴉科技創始人呂騁發布智能硬體產品Raven H:這個在百度邀請函上出現的白盒子,也是百度第一方智能硬體。
"現在市面上的智能音箱可能分為捲紙、垃圾桶、保溫杯和空氣淨化器。「這位90後的創業者一上臺,就diss了目前市面上已經有的智能音箱的設計。「但能讓用戶像對iPhone那樣發出WOW的感慨,似乎還是遙不可及。」
「我們回想一下iPhone的誕生。在iPhone之後,所有手機幾乎都長一個樣。因為iPhone把手指交互做到了極致。說到人工智慧時代,大家的第一反應就是智能音箱了。「而呂騁認為,目前的所有音箱都沒有達到蘋果一般的體驗。」
渡鴉在設計上破費心思周章,聯合瑞典Teenage Engineering團隊,為這款產品「站定了顏值制高點「。
而在產品性能上,以下數據值得參考:
此外,本款硬體還聯合了全球一眾重磅合作夥伴,稱,選擇了「魚市裡面最好的魚」,用最好的食材做出食品。
此外,呂騁還詳細介紹了從材料、噴漆工藝、音質上的巨大投入和效果。
交互來看,呂騁稱,目前階段,市面上音箱所遵循的voice only原則是違背用戶使用習慣的。Raven H保留了Touch模塊,既是屏幕,也是可卸下來使用,觸摸操作。Touch被取下後,可以按住說話,雙擊暫停,滑動切歌,解決了智能音箱的操作距離問題。
技術上,Raven H全面接入了DuerOS 2.0,以及億萬級的數據請求。5米內的喚醒率做到了95%,誤喚醒率0.042次/小時。速度上,平均1.4秒的平均響應速度。
在歌單上,定位了7700+定位場景。「來首搖滾」,「換首中文的」,「這首歌是哪張專輯的?」,「這張專輯還有什麼好聽的歌?」「我要聽陳奕迅、莫文蔚、梁靜茹的歌「,呂騁現場演示了與Raven H的互動,以及唱出一段」跑調「的音樂片段讓Raven H找到相應歌曲。
Raven H還引入了一種新的交互模式--如意說。高度自定義可以給H隨意改名,換嗓音等。
Raven H定價1699元,相比天貓精靈在剛剛過去的雙十一上99元的低價,這一價格公布時立刻引起了現場一陣驚呼。「我知道其他老闆賣多少錢,但是我們希望家庭大腦這樣的產品成為未來家庭的必需品。「
渡鴉還與洲際酒店集團達成合作,打造智能客房。
作為果粉,呂騁在發布會上也推出了one more thing環節,Raven H搖身一變現身可以跳舞賣萌的智慧機器人,並換聲呂騁的聲音共同主持。
這款智能音箱目前已經在渡鴉官網發售。
百度副總裁沈抖發布手機百度10.0
此外,百度副總裁沈抖介紹並發布了手機百度10.0。沈抖首先指出了今天信息搜索的幾大痛點:今天的手機在AI推動下有了本質飛躍,現在手機有了聽說看的能力和計算能力,在中國,平均一個網民花費3.5個小時在手機上。但是,有一系列挑戰出現:首先,大量出現的信息,其中和我們真正相關的信息並不多。我們選擇信息的能力和手段並沒有顯著提高。其次,信息服務不夠好,不能幫人們高效獲取信息。網際網路的出現,解放了人們的認知能力,但還遠不夠。即使到了智慧型手機時代,觸屏手機出現,還是不能很好的發揮人類最自然的交互方式,語音交互。
「我們真正需要的是我們自己的信息。概括來說,AI賦能的新移動時代有3個特徵:更簡單的獲取——給合適的人推薦合適的信息;更自然的交互——跟人當時社會環境和認知能力相符合的交互;更真實的體驗——能夠在資訊時代與物理世界交互,身臨其境由超越現實。」
搜索+信息流,有事搜一搜,沒事看一看▲
更簡單的獲取:
(這裡播放了一段現場記者認為略尷的VCR:百度手機新體驗-一名保安,通過手機百度長成研發工程師的過程。)
沈抖介紹了近年來百度搜索技術的進步:通過超鏈分析的技術,基於超鏈的信息組織結構,可以準確判斷網頁的去哪維度,幫助用戶平等便捷的找到信息,找到所求。到了移動時代,視頻圖片不再基於超鏈,而是基於知識圖譜。百度有世界上最大的知識圖譜,有超過一億節點,超過一千億的屬性和關係。百度比世界上任何一個其他平臺更有能力理解用戶意圖,為中國7.5億網民在200萬維度上進行了精細刻畫,形成了完整的用戶畫像。有了知識圖譜和用戶畫像,百度更有能力理解用戶真實需求。
更自然的交互:
最近爆發的短視頻有巨大的潛力,但是有兩個問題:這個視頻值得看嗎?看完意猶未儘是否有類似的。手機百度完美解決了這一問題。百度對長短視頻進行了自動匹配:為1000萬+段視頻,匹配到了100萬小時長視頻,99%準確率。
(接下來又播出了一段vcr:小朋友和大人的搜索結果不一樣)
百度語音交互的多維度語音信號:性別-地域-年齡-語速-輕聲,帶來定製化結果。
更真實的體驗:
最後,沈抖現場演示了AR交互感受兵馬俑,與兵馬俑對話,並遊覽兵馬俑一號坑。