科技範兒十足的百度AI開發者大會,連喝茶都不走尋常路……
「茶博士,給我來杯茶。」
「客官,喝茶前先為您展示一段長嘴壺茶藝表演怎麼樣?」
「好啊,你都會什麼茶藝?」
「我會的可多了,您要看哪一個:鳳舞九天、春風拂面……魚躍龍門」
「就這個吧」
「好嘞,您瞧好了 」
……
「茶博士」移動到茶桌附近,以一招精湛的「魚躍龍門」,將長嘴茶壺揮舞在空中旋轉。一氣呵成,完成長嘴茶壺倒茶的系列動作。
7月3日,百度CTO王海峰博士在「Baidu Create 2019」百度AI開發者大會主論壇上,與「茶博士」的逗趣互動十分搶戲,這個獲得滿堂喝彩的「茶博士」其實是一個機械臂。
這個茶藝機械臂,背後是機器人視覺、語音、自然語言處理等多個領域的人工智慧技術的賦能。通過綜合運用這些AI技術,百度打造了一個可以語音交互,又擁有高超茶藝水平的茶藝機器人。
茶藝機器人的伶俐言辭要歸功於百度的語音能力,以及智能對話系統訓練和服務平臺UNIT。在語音方面,基於百度大腦流式多級截斷注意力模型(SMLTA)使茶藝機器人的語音識別速度和準確度大幅提升,而茶藝機器人能夠流利的回答,是藉助百度大腦風格遷移的語音合成技術,僅需20句話就可以製作一個人的專屬聲音,不僅保留語音中的音色、風格、情感等要素,使用時還可任意組合、靈活控制。而UNIT平臺則為茶藝機器人提供業界領先的對話理解和對話管理技術,比如準確理解用戶指令的強大的泛化理解能力,根據TTS播報的打斷位置,判斷用戶指代的列表項,做出精確反應等,UNIT平臺與語音的融合,可以讓人與茶藝機器人進行智能對話互動。
茶藝機器人想要動作瀟灑、揮灑自如,則要藉助3D視覺跟蹤技術。這一技術可實時檢測茶杯三維位置信息,即使顧客任意放置水杯,它也能精準獲取杯子位置。此外,根據長嘴壺的特殊形狀及其特定的水流出水方式,茶藝機器人能自動生成合理的茶壺運動軌跡,出色完成無水濺出的倒茶效果。
短短2分鐘的表演,背後是百度大腦AI技術的雄厚積累。從產業的角度看,想要實現類似的效果,需要技術儲備的寬度和技術打磨的深度。今年的百度AI開發者大會上,作為百度AI多年技術積累和業務實踐的集大成,百度大腦正式升級為5.0,成為軟硬一體的AI大生產平臺,為產業開發者帶來更多可能,讓他們能藉助AI技術實現產業的智能化升級,打造新業態。
未來的AI,充滿想像!今天的機器人擅長茶藝表演,明天的機器人或許會做大碗寬面,後天……小二,來一碗大碗茶配大碗寬面!