作為打造了國內第一大輸入法和第二大搜尋引擎的網際網路公司,搜狗在 AI 領域的技術實力不容小覷。
在 5 月 17 日舉行的「全民營養周」啟動儀式上,搜狗再次推出一款讓人眼前一亮的產品應用——搜狗 AI 營養師。
這是一款非常實用的工具。我們生活中想必都遇到過類似的「飲食盲區」:比如吃什麼對胃好?糖尿病應該吃什麼不該吃什麼?嬰幼兒、孕婦吃什麼有助於發育或健康?這樣的問題總是層出不窮,而我們身邊卻少有專門的醫生或營養師能給予專業的膳食指導。
搜狗 AI 營養師的誕生則可以 7×24 小時在線解答這類問題,而且在權威性方面,全部回答都是經由中國營養學會指導,與國內多位知名營養學專家合作產出。
另外從交互體驗層面來說,搜狗 AI 營養師的一大亮點就是為其打造的分身技術。
AI 營養師在說話時的表情變化、語音語調、甚至是問答的邏輯感似乎都與真人無異,與市面上很多卡通或二次元的 AI 形象相比形成了明顯的差異化,引發不少網友驚嘆「太逼真了」。
AI 營養師背後包含了搜狗怎樣的技術創新和發展路徑?這款產品又承載著搜狗怎樣的戰略目標和野心?DeepTech 在與搜狗公司副總裁許靜芳的交流中了解到更多細節。
用 AI 思路解決社會痛點
為什麼要做這樣的產品?從普惠程度上來說,AI 營養師背後所面對的用戶痛點和需求是十分凸顯和普遍的。
當前中國註冊營養師的缺口非常大,我國每 10 萬人擁有營養專業技術人員的數量僅為 3.53 人。對比日本,營養師佔全國人口的比例,是每 300 人配備 1 名營養師。
要達到《健康中國 2030 規劃綱要》中提出的,到 2030 年,實現每萬人配備 1 名營養指導員的目標,仍然任重道遠。與此同時,來自搜狗搜索的大數據顯示,每天平臺收到近 320 萬人次關於疾病飲食類的問題搜索和諮詢,圍繞「能不能吃」、「該怎麼吃」,公眾大量個性化問題無法得到及時解答。
圖|AI 營養師交互界面(來源:搜狗)
一端是不同的人群分類和多樣性的諮詢需求,一端是千百種常見疾病,還有一端是各種各樣的食物類別和不同營養元素,能否通過一款產品打通三個維度?這成為了激發搜狗團隊想要認真做這件事的重要驅動因素。
許靜芳介紹,「AI 營養師」項目從立項到成功推出前後經歷 1 年左右的時間,內部團隊經歷了從提出設想、專家論證,後續包括知識庫的搭建、算法實現、交互形式、AI 分身製作等諸多流程,基本邏輯就是讓 AI 模擬人類醫生是怎麼推斷思考的。
真人營養師的常規服務路徑,是針對不同人群、不同疾病,在日常、診中、診後等不同環節,結合人群實際需要,就膳食部分提出合理建議。而在膳食建議中各類食材、營養元素及成分比例的知識相對固定,讓 AI 學習並掌握這些知識,進而像醫生一樣去推理給出答案,是此次搜狗給出的創新解決方案。
圖|根據用戶不同的健康狀況個性化解答並生成飲食報告(來源:搜狗)
與真人營養師相比,AI 擁有對海量知識的記憶能力、對數據的處理調用及計算能力,能夠 7×24 小時在線不間斷工作,並且可以通過不斷學習,掌握更全面詳細的知識圖譜。此外,醫療健康行業需要的是專業知識與人文相結合的服務,只有專業知識沒有人文,用戶也不一定接受或信服,因此人機之間的互補協作尤為重要。
此次搜狗通過 AI 分身打造的逼真形象與自然語言的交互方式,讓 AI 營養師與人們的日常距離更加貼近,在擁有強大計算推理能力的同時,又能給人以親近感和信服感。
AI 營養師背後的技術積累與突破
一款好用的產品背後,往往是對技術的創新突破和融會貫通,對於搜狗 AI 營養師來說,能實現既逼真又智能的體驗背後得益於搜狗的兩大核心技術:AI 分身和知識計算。
直觀層面,先說說 AI 營養師為什麼會這麼「真」。背後的搜狗 AI 分身技術其實主要由兩大引擎組成,即語音合成引擎和形象合成引擎,基於少量目標說話人的音視頻數據,通過行業領先的多模態合成技術,即可完成對目標說話人AI分身的定製。最後的呈現效果就是只要輸入一段文本,就能生成與真人無異的播報效果。
過去幾年,搜狗在知識計算方面也一直持續積累保持業內優勢,搜狗搜索開發的汪仔機器人登錄江蘇衛視的《一站到底》節目,成為中文的知識問答競賽中首個戰勝人類的機器人。此外,還曾在 WMT、IWSLT、NTCIR、Stanford COQA、NLPCC 舉辦的機器翻譯、人機對話、閱讀理解、信息抽取等多個任務中取得第一的成績,還開源了業內最全閱讀理解工具集合。
在推出 AI 營養師之前,搜狗基於 AI 分身技術還曾打造過 AI 合成主播、AI 虛擬法官、AI 客服等分身應用,都引起了不小的關注度,搜狗在這條技術路徑上也獨樹一幟。
在當下的人工智慧行業,多數企業在 AI 形象方面都是採用 3D 技術塑造一個虛擬形象,但這跟真人比起來仍存在明顯差異,難以實際應用起來,而真人驅動的 AI 技術,目前比較集中在人臉檢測、面部追蹤、實時渲染等諸多分散方面的能力,這些都尚不具備輸入文本驅動虛擬形象的視頻生成能力。
搜狗 AI 分身研發團隊找到了這樣的市場切入點填補了技術空白,也成為了搜狗在 AI 戰略層面的特色差異化打法,可以把人從重複性高和任務量大的工作中拯救出來。
而此次搜狗 AI 營養師這一職業分身與此前分身相比最大的突破是,如果此前只有信息的輸入和輸出播報,那麼本次推出的 AI 營養師則是真正具備自己的知識儲備、交互能力和推理能力的。
相比外觀形象逼真,讓機器人有智商,具備理解、推理能力顯然是更難的一件事,尤其還要保障其推理結果的正確性和可靠性。
圖|AI 營養師的知識計算和推理過程(來源:搜狗)
以 AI 營養師的實際應用場景為例,比如一個生活中常見的問題:老年人得了高血壓夏天能吃西瓜嗎?對於用戶來說,需要的並不是一個簡單的判斷結果,而是需要更多有針對性的解答和建議。
所以在知識計算環節,AI 營養師首先要做的並不是武斷地判斷能不能吃,而是要先通過多輪交互精準理解用戶的主需,充分掌握該用戶更全面的基礎疾病或慢性病情況,解析出「人群:老年人;疾病:高血壓;主需:能不能吃西瓜,衍生:吃什麼水果好」四大元素,從而構建起一個用戶的整體畫像,基於此,再將用戶口語化的語言,與專業術語相關聯,對問題做拆解和識別,綜合多個知識庫的知識計算推理過程,從而得出針對用戶不同飲食需求問題的個性化膳食指導。
在過去一年,搜狗通過與中國營養學會的合作,搭建了疾病人群膳食建議知識庫和食物營養成分知識庫,構建了目前國內飲食營養領域最全面最權威的營養健康知識圖譜。
據了解,搜狗 AI 營養師目前已覆蓋 18 種不同人群的人群庫、超過 1800 種食材營養素的食材庫以及超過 2000 種疾病飲食建議的疾病庫,這是 AI 營養師可信任的基礎,對於整個大健康行業來說堪稱一大創新成果。未來,希望通過人機對話的方式為公眾營造沉浸式體驗,較大程度提升醫療健康科普的有效性。
搜狗 AI 更大的想像空間
從技術層面來看,這次搜狗跟中國營養協會合作推出的 AI 營養師是搜狗在自然交互的基礎上,通過搭建相關領域的知識庫並結合知識計算能力形成的專門針對健康行業的「智慧助理」,可以為行業和用戶日常提供更深層次的智慧解決方案。
而從市場的角度看,搜狗通過一款實用性較高的 AI 工具作為切入點,有機會撬動萬億級的大健康行業商業版圖,這或許比很多傳統的網際網路醫療產品來得更有效率。
站在整個公司戰略層面來講,搜狗已經打造了中國市場排名第一的輸入法,第二的搜尋引擎,在此基礎上,搜狗已逐漸構建起以語言為核心,延伸出自然交互和知識計算的 AI 技術體系。
這讓搜狗在對語言的理解技術方面形成了強大的壁壘,圍繞語言 AI 為核心,展開包括對語言的理解、知識計算、人機對話、跨語言翻譯、多媒體跟語言的轉換等等諸多技術應用的落地。
此次 AI 虛擬營養師的亮相,也是在此戰略下的又一次技術智慧化升級。
「如果說通用的 AI 大家可能進展都比較緩慢,那麼在認知層面,比較可行的路徑就是在一個專業垂直領域去實現突破,搜狗今天有 AI 營養師,未來可以有會思考的 AI 醫生顧問、AI 律師、AI 心理諮詢師等等,在每一個方向上面,讓機器去慢慢接近人的能力,在認知程度和知識計算方面不斷取得突破,才能不斷拉近機器和人之間的距離。」許靜芳說到。
而我們也可以看到,隨著 5G 和智能時代大幕的拉開,搜狗 AI 技術也在不斷的進化過程中,期待未來能夠為新聞傳媒、健康醫療、在線教育、教育金融、遠程客服、影音娛樂等眾多領域提供更豐富的智慧解決方案,賦能垂直行業升級。