中關村創業大街,這個曾見證網際網路創業熱潮的著名地標,也曾陷入冷寂。
而今,」智能+「已經成為時代新命題,這條大街又因AI有了新的活力。
去年12月底,百度大腦在中關村創業大街開設第一家「線下體驗店「,引來人頭攢動。3月20日,首期百度大腦開放日在中關村創業大街舉辦,更多了一份熱鬧。
過去,在創業大街上生長起來的很多網際網路產品與技術已經與我們的生活難以分割,如今AI到來,又會是一種什麼景象?
在百度大腦開放日上,百度大腦帶來了24種全新開放的AI技術,20個鮮活的落地案例,用滿滿的誠意與開發者一起展開對未來的想像。
用AI的熱度 去溫暖每個角落
整場開放日,最令人印象深刻的案例是「智能貓窩」,看到冬天裡無家可歸的流浪貓,百度大腦工程師晚兮利用百度大腦的動物識別技術和百度EasyDL,打造出了配備「貓臉門禁」、「病貓識別」、「絕育識別」三大黑科技的貓窩,不僅可以識別174種不同品種的貓咪,還可以識別貓口炎、貓鼻支、貓皮膚病、貓外傷4種常見貓病,發現未絕育的貓,幫助志願者及時救助。
和流浪貓一樣,垃圾分類也是一大社會難題。分形科技藉助百度EasyDL的圖像分類技術,打造了首款智能垃圾桶,可以對7種常見垃圾自動分類;
德邦物流為了讓用戶免去自行填寫信息的麻煩,使用百度大腦的定製詞法分析快遞申請,一秒拆分姓名、電話、住址等信息;
看到審批窗口總是排滿長隊,科鴻智信利用OCR 、iOCR及EasyDL平臺開發了智能化審批管理系統,建立起「一次都不跑、隨時隨地辦」的便民服務新模式。
嫌棄滑鼠的功能太雞肋,有開發者集成百度的語音識別和合成技術、翻譯技術 ,打造了智能語音滑鼠,語音輸入速度可以達到每分鐘400字,比傳統鍵盤輸入提升了兩倍,並且支持28種語言的翻譯;
還有開發者為了方便控制跑步機,使用百度大腦的語音識別和UNIT技術,開發了可語音控制的跑步機,動動嘴就可以切歌、速度控制、模式變換等,據說月銷量已經高達一萬臺以上。
以上這些在開放日展出的案例,只是百度大腦落地案例冰山一角。2018年百度大腦在6個城市舉辦了7場行業創新論壇,針對企業服務、信息服務、地產物業、智能零售、智能工廠、智能校園、智能政務推出了7大行業解決方案,AI能力已然滲透進產業的毛細血管,從而影響我們生活的方方面面。
正如百度AI技術生態部總經理喻友平在現場所說,「人工智慧應用的領域可以說無處不在,只要企業、開發者、合作夥伴們能有發現問題的眼睛,就有創新創業的機會。百度大腦把平臺和AI能力開放出來,希望幫助大家快速地實現各自領域的業務解決方案,創造全新商業模式,帶來更多機遇。」
研發不是炫技 是對技術賦能的踐行
作為百度在人工智慧領域多年研究的集大成,百度大腦在2016年正式開放後,已經開放了語音技術、視覺技術、自然語言處理、知識圖譜、機器學習等近160項通用AI能力,有著超過100萬的開發者,已然成為服務規模最大的AI開放平臺。
對於百度大腦而言,技術的創新並沒有盡頭,就像是一場「打怪升級」的遊戲,一直追求的是怎麼讓技術更好用,怎麼將效率再提高一些,最終實現「用AI讓複雜的世界更簡單」。
在百度大腦開放日當天,百度AI技術生態部總經理喻友平一口氣介紹了新開放的24項AI技術能力,囊括視覺、自然語言和語音。以往開發者要苦苦研發上月的技術,在百度大腦都可以一鍵獲取。開放一個全新的AI技術,開發者就可能創造出一個全新的AI應用,實實在在改變生活。
在視覺方向上,OCR、車輛分析、人臉識別、圖像識別都有數項更新。百度的OCR全系列產品多達34種,覆蓋了卡證、票據、文檔、汽車等場景。
如果你是一名戶籍系統相關的開發者,只需要對著戶口本拍一張照片,系統就能欄位進行結構化識別,然後反饋出信息頁的出生地、出生日期、姓名、民族、與戶主關係、性別、身份證號碼,將會幫助相關工作人員減輕大半的工作量。目前,百度在OCR上的能力最為全面,對於開發者來說,在同一家平臺上就能找到應用場景的對應技術,十分便捷。
如果你是一位交警或者停車場管理員,一定會對百度大腦的車輛分析技術點讚。百度大腦推出了車輛檢測、車流統計、車輛屬性分析、外觀損傷識別等服務。其中車輛檢測功能,可以通過識別圖像中的所有機動車輛(包含小汽車、卡車、巴士、摩託車、三輪車),反饋每輛車的類型和坐標位置,並對每類車輛分別計數。
如果你是一名自拍愛好者,百度大腦顯然知道你想要的是什麼。百度大腦新增了人臉情緒識別,並升級了人臉關鍵點檢測和手勢識別,人臉檢測關鍵點由72個增至150個,常見手勢能識別也達到了24種。這些技術落地之後,人臉識別不再局限在解鎖和美顏,將帶來更多有趣的應用:錄製短視頻時有更豐富的手勢特效,識別你的情緒自動匹配背景音樂等等。
語音和語義識別也是百度大腦升級的重點,包括語言處理應用平臺、語言處理應用技術、語言處理基礎技術、知識理解以及知識圖譜。
在百度大腦開放日上,令人印象深刻的演示是三個有趣的應用:
一是新聞摘要,對新聞內容進行全面的語義理解與分析,然後自動抽取新聞文本中的關鍵信息並按指定長度生成摘要,可以應用於熱點新聞聚合、新聞推薦、語音播報、彈窗推送等場景,幾乎是所有新聞工作者的福音。
二是智能寫詩,用戶只需要輸入任意主題詞(如公司名、節氣名),百度大腦便可自動生成融合了該主題詞的詩詞。實際測試顯示,百度大腦的智能寫詩在語義和語境上並沒有明顯的違和感,不失為娛樂化營銷的又一重要工具。
三是智能春聯,今年的央視春晚上,主持人高博就演示了智能春聯「看臉」的絕活兒,通過「刷臉」生成專屬春聯。如今這項技能也被百度開放出來,何嘗不是人工智慧融入美好生活的一個典型案例呢。
在語音方面,百度首次對外開放了搭載國際領先的注意力(attention)模型的語音能力,擁有更快的響應速度,相對識別準確度提升15%。同時中英文混雜和純英文自由說,既能識別方言又能識別普通話,那些曾經讓用戶和開發者頭疼的問題,在這裡被一次性解決。
不止如此,百度還即將上線很多新產品:零代碼自助訓練語音識別模型,可以幫助開發者提升業務場景下的識別準確率;而遠場語音開發套件,則可以應用於機器人、兒童故事機、家電、車載設備等硬體,語音識別將無處不在。
在喻友平看來,百度大腦的開放生態有著以下優勢:一個是技術領先,百度很早就成立了深度學習研究院,並且早在16年開源了國內第一個深度學習框架paddlepaddle,在各類國際比賽上也取得過非常多的獎項,並且聯合舉辦了像上面介紹的國際權威競賽,在這樣的技術號召力下,聚集了非常多的人才,這是技術得以持續保持領先的基礎;
一個是技術布局非常全面,從感知到認知,從語音到視覺到語義到AR等等,非常全面,可以幫助大家一站式的獲得服務,提高集成效率;最後,我們以可落地為目標,在降低人工智慧應用門檻的這個方向上持續不斷的努力,所以雖然只開放了兩年多的時間,但進化速度也非常快。
「我們可以看到整個平臺的架構,從模型到軟硬一體,從深度學習框架到解決方案,從雲服務到多種輸出方式的支持,各個層面都快速豐富起來。我們也非常重視各個企業和開發者提出的需求,並且特別感謝在這個進化過程中大家的包容與支持。」
藝術家們喜歡讓人們從作品中了解自己,如同在蒙娜麗莎中思考達文西,在第九交響曲中聽懂貝多芬。
百度大腦似乎有著同樣的情愫:用開放生態,為開發者提供發揮想像力的「黑土地」,讓AI走向社會的每一個角落。
喻友平談到,人工智慧應用的領域可以說無處不在,只要企業、開發者、合作夥伴們能有發現問題的眼睛,就有創新創業的機會。百度大腦把平臺和AI能力開放出來,希望幫助大家快速地實現各自領域的業務解決方案,創造全新商業模式,帶來更多機遇。