AI變革下的「百度一下」

2021-01-14 百家號

允中 李根 發自 凹非寺量子位 出品 | 公眾號 QbitAI

百度世界大會,百度一年一度的技術和產品展示。

在今年的百度大會上,Apollo、DuerOS、信息流&手百等都產品均發布了自己與AI結合的最新進展。

作為百度最廣為人知的核心業務,百度搜索也在AI技術的不斷加持與變革中,進展飛快。

如今「百度一下」,有了嶄新面貌。

AI變革,百度一下

在百度世界大會現場,搜索工程師們透露了最新進展。

他們認為,雖然搜索系統從被創造的第一天起就是一個人工智慧系統,但是隨著近年來深度學習技術的快速發展,在AI時代的搜索更加的智能化。

其中集成了人工智慧領域在自然語言處理、機器學習、圖像識別、視頻理解、語音識別等方向的前沿算法以及高性能架構,變得更加的智能化。

也可以說:搜索是當前人工智慧技術的集大成者。

具體則體現在三大方面:

對語義的理解更加精準,排序效果顯著提升Smart Answer的能力從文本搜索向語音、視覺、視頻等多模態搜索演進而且,這些技術表現,也並非完全神龍見首不見尾,每一項技術之於產品的提升,其實並不是無跡可尋。

不妨一項項拆分理解。

AI變革-語義理解

這項可能要從搜索技術原理說起。

在深度學習加持之前,百度搜索更多的策略來自經驗匹配規則和大數據挖掘和統計信號。

如:QUERY = ABC,工程師就會去找和ABC完全匹配的內容和結果。

算法上則是傳統的BM25、proximity等人工算法,而更多Query語義理解和內容語義理解的問題,選擇採用多層優化同義詞挖掘、相關詞挖掘、緊密度、重要性計算等等方法來解決。

但是,這種做法的較大不足在於錯誤傳播,並且挖掘的方法的泛化效果較差,導致了很多語義相關的結果無法召回,同時系統對結果好壞上沒有連續過渡的判斷。

而如果運用深度學習,一切則變得不同。

通過深度學習技術,讓多層神經網絡可以自動從百度搜索海量的數據中去學習目標,抑制錯誤傳播的問題,讓更多語義相關的結果被召回和排序到合理的位置,更好的滿足用戶的搜索需求。

比如在用戶搜索中,查詢詞 「用高溫開水將勺子湯鍋後,勺子上有一層灰」 ,得到結果的過程中,就涉及語義理解。

搜索工程師透露,百度早在13年上線了深度語義理解模型,較好地解決了這類問題,深度模型能從海量的數據中自動學習到了「高溫」和「開水」、「燙」之間的關聯關係,同時也學到了「有一層灰」和「表面汙垢」的相關性。

而如果採用傳統匹配算法,在近義相關結果上,就很難將相關性算好。

正是得益於深度學習算法,最終幫助實現了排序算法提升,可以將優質的結果排上來,提升用戶體驗。

此外,早期語義計算還存在一些明顯的不足和問題,全文內容信息未引入建模過程,導致建模並不充分。

進而會有兩方面挑戰:

一方面,已成功應用的模型多針對短文本進行建模,在長文本方面直接應用效果並不理想。

另一方面,對長文本進行在線計算、增加更多的匹配細節信息會導致模型運算量急劇提升,這對系統架構和運算能力是一個非常嚴峻的考驗。

所以在模型和架構上,也必須要有相應對策。

百度搜索團隊探索後給出2大針對性方案。

深度學習模型上,研發了Content-Matching-Matrix內容理解模型,首次成功刻畫了索引對象內容的語義相關性,提供了語義匹配細節信息。

△ Content-Matching-Matrix內容理解模型結構示例

基礎架構上,研發了Ranking-Service搜索智能化架構,首次將GPU引入大規模搜尋引擎在線語義相關性計算中,實現了百度搜索上複雜語義模型的毫秒級運算。

△ Ranking-Service搜索智能化架構示例

此外,為了解決千億級規模數據的深度學習訓練挑戰,以及內容語義理解模型的在線計算性能問題,百度搜索方面還專門設計了離在線混合架構,並部署了超大規模的GPU集群,使得複雜算子的實時在線計算延時減小了一個數量級,使其這些算法在線應用成為可能。

當然,投入成本之高也不難想見,只能說百度為提升搜索體驗,在所不惜。

AI變革-Smart Answer

AI變革搜索的第二項表現是Smart Answer.

相比於傳統URL Ranking,給予用戶多條相關的搜索結果及摘要,讓用戶點擊到落地頁去尋找答案,直接給予用戶答案滿足的能力,是未來搜索產品智能化演進的一個重要方向,因此Smart Answer應運而生。

Smart Answer技術通過更強的用戶需求理解和內容理解能力,通過對搜索結果及上下文進行分析,從搜索結果和知識庫中提取滿足用戶問題的精準答案。

這種方式能夠更好、更高效的滿足用戶搜索需求。

Smart Answer在百度有很多的場景,不僅僅是在搜索結果中。在用戶瀏覽圖文、視頻內容的時候,可以為用戶對內容中的信息的延伸滿足。

更重要的是在AI時代,會有越來越多的遠場語音交互的場景及視覺交互場景,在這些全新的智能硬體設備上,用戶篩選、瀏覽的交互成本變大,而通過單條結果或交互問答的方式精準滿足用戶需求是能夠更適合新場景的搜索結果形態。

而這樣Top1直接滿足的能力,從百度最新財報中披露,比例已超過40%。

並且不止於搜索和百度App中,包括在小度在家等產品中,應對一系列日常提問,也能看到不少Smart Answer的覆蓋。

△ 搜索能力在端上以及DUEROS上的輸出

AI變革-多模態搜索

最後,可能也是最直觀的一項:多模態搜索。

即搜索方式到結果,從文本搜索向語音、視覺、視頻等多模態搜索演進。

隨著硬體、帶寬以及智能設備的普及,越來越多的富媒體內容出現在了用戶生活中,如圖片、語音、視頻等。

為了解決這部分需求,百度在2015年就開始提出了多模搜索的理念,包括輸入和輸出的多模態兩個方面。

在輸入方面,百度搜索認為語音和視覺是未來人們和搜索系統交互最重要的方式,除了傳統打字以外,隨著各類傳感技術的發展,說話、拍照、動作、人臉等都是用戶表達搜索需求的方式。

在輸出方面,除了傳統的圖文網頁結果,視頻、全景圖、3D模型、VR/AR等內容都是承載信息且讓用戶更直觀、更易懂的需求滿足形態。

基於對未來發展趨勢的判斷,百度搜索也加速語音搜索、視覺搜索、異構內容索引及理解等技術的演進。

而且最重要的是,多模態搜索,也會讓用戶更直直觀感受AI帶來的不同。

比如現在均已能在百度App中體驗的語音搜索、拍照搜索、實時翻譯、植物識別、視頻搜索及AR等技術,均是百度多模思路下的AI研究和產品成果。

在語音搜索上,百度搜索集成了語音識別、語音合成、語義解等多項AI技術,讓搜尋引擎能「聽」會「說」,不僅能夠聽清、聽懂,還能深入理解語義,給出繪「聲」繪色的最佳搜索答案,讓搜尋引擎與用戶之間的交互方式變得更加自然、流暢、便捷。

在視覺搜索上,百度搜索綜合了百度大腦在圖像識別、人臉識別、OCR、物體檢測、實體匹配等多項視覺技術,並依託於搜索系統對全網圖像、視頻內容的索引以及用戶行為,得以細粒度的識別用戶實時錄製視頻流、拍照及上傳圖片中的實體和文字,進而圍繞實體在用戶視覺場景下的需求,連結並組織相關內容及服務提供給用戶,實現諸如拍題搜索、商品搜索、實時翻譯、植物識別等智能視覺搜索能力。

在實時翻譯上,百度識圖實現了一整套實時文字計算的移動端算法套件,包括文字發現、關鍵幀篩選、SLAM、OCR、NMT、MR等技術。

同時依託移動端深度學習計算框架,完成移動端部署。在這些技術的支持下,用戶打開相機即可在畫面內原文字位置直接看到翻譯後的文字結果,讓用戶在實景文本翻譯場景中,得到類人眼體驗,更便捷高效實現」所見即所得」。

除了更全面的響應用戶不同形態的輸入,百度搜索也在全面對內容輸出進行「升維」。

在過去,搜尋引擎主要滿足用戶的內容,是提供包含相關圖文的網頁結果。

而隨著當前內容生態的視頻化爆發趨勢,百度搜索認為視頻作為一種新的通用信息載體,是更直觀、易懂的內容形態,相比於圖文有更大的信息容量,視頻化的搜索能夠讓搜索更生動、更真實,同時具備與圖文同樣寬廣的需求滿足能力。

同時全景圖、AR、VR等未來能進一步豐富人們獲取信息方式的新內容形態,也是百度當前積極布局的新領域。

比如在需要更加沉浸化、空間感的場景,百度引入全景圖資源,幫助用戶更好的感知場景的真實信息,結合VR模式,可以達到身臨其境的效果。

在需要更形象表達的場景,百度通過AR、3D展現的方式,幫助用戶全方位了解事物的信息,幫助兒童更好的認知和學習。

通過百度搜索團隊的介紹,可以看到,百度搜索在AI的加持下,在語義理解、smart answer、多模態搜索等領域上取得了重大的突破與卓越的成果。

憑藉對用戶需求深入骨髓的理解與專業精深的技術能力,百度搜索團隊不懈努力,將過去只存在在科幻電影中的場景,一個個轉化為了用戶真正可以便捷使用的智能產品。

AI加持下的「百度一下」,正在變得更準確、更便捷,更全能。

— 完 —

相關焦點

  • AIIA 2020人工智慧開發者大會召開,百度副總裁劉雅雯:AI將深入變革...
    「人工智慧會像機械技術、電氣技術一樣,持續滲透和變革人們生產、生活的方方面面,成為科技革命和產業變革的核心驅動力量。」9月28日, AIIA 2020人工智慧開發者大會在北京市首鋼園區拉開序幕,百度副總裁、智慧城市事業部總經理劉雅雯出席並發表演講,「人工智慧技術發展日趨成熟,已呈現出很強的通用性,具有標準化、自動化和模塊化的工業大生產特徵,能夠深入賦能各行各業。百度通過百度智能雲把人工智慧輸送到千行萬業,幫助很多產業實現智能化升級」。劉雅雯還為大會帶來了百度AI在智慧城市、鋼鐵、農業等多個領域的成功落地應用案例。
  • 意外的AI測試 百度顏值評分,二哈成美女
    前段時間在公眾號裡接了百度的ai顏值,今天無聊發了個二哈上去,呵竟然識別為美女,評分還不低呢 我還以為是我api接錯了,深夜debug,結果發現這就是百度給的結果,不敢相信自己,試了試他們自家小程序,狗還是那條狗,評分依舊
  • 當百度輸入法有了AI加持!用戶終於迎來了輸入體驗的二次變革!
    而現在,像百度輸入法,在語音輸入體驗方面,得益於AI技術的加持,在語音輸入體驗方面帶來了全新的升級。百度輸入法的語音輸入功能的開啟非常簡單,不需要任何設置,只要在任意輸入界面下,長按空格鍵,即可進入輸入界面。如果,你是一個習慣於鍵盤輸入的用戶,也絲毫不影響你去使用語音輸入的方式,只要長按空格鍵即可開啟語音輸入功能,上手非常簡單。
  • 百度李瑩:百度如流智領工作方式變革 推動企業數位化轉型
    當智能化轉型席捲千行萬業,企業內工作方式的智能化變革也悄然而至,並逐漸成長為推動企業轉型的重要力量。12月10日,百度旗下新一代企業智能工作平臺如流亮相2020數位化轉型世界論壇,展示了百度以AI技術優勢賦能企業工作方式,為企業數位化轉型提供強大「推動力」。
  • OpenEdge全面開源 百度雲加速雲端技術變革行業
    百度雲副總經理李碩百度雲副總經理李碩在演講時表示,人工智慧是引領產業智能化變革的戰略性技術,百度雲正以多種形態輸出AI能力,讓各行各業擁抱智能化變革變得更簡單。作為面向企業級市場的智能雲計算服務平臺,百度雲是真正AI技術,產品和解決方案落地的載體,以ABC三位一體為發展戰略,讓百度領先的AI能力快速落地,為各行業智能化轉型提供解決方案。
  • 聚焦人民日報創作大腦,百度智能雲驅動媒體產業加速變革
    9月,在2020中國網絡媒體論壇上,百度CTO王海峰便聚焦媒體行業重點闡述了軟硬一體化AI基礎措施——百度大腦在驅動智能經濟發展上的能力,並同期帶來面向媒體行業的智能媒體中臺。王海峰表示:「希望在AI新基建的助力下,網絡媒體產業加速智能化,開啟智慧媒體新時代。」很快,這個期望便取得了不錯的反饋。
  • 百度輸入法全新功能,AI滑行輸入了解一下
    為了改善用戶的體驗,百度輸入法突破局限,打造出了符合國人設計的九宮格輸入法,並且加入了AI滑行設計。作為國內第一大輸入法軟體,百度輸入法的日活用戶數已經國內第一,新版本更是加入了全新功能,今天筆者就跟大家來分享一下強大的百度AI滑行輸入功能。
  • AI筆刷-Ai專用閃閃發光的矢量畫筆
    百度網盤下載連結:https://pan.baidu.com/s/1l17XKctA1zbINcqBr479sw提取碼:cwrx複製這段內容後打開百度網盤手機App,操作更方便哦備用微雲下載連結:https://share.weiyun.com/55brSja 密碼:xhimqf
  • 付一夫:百度AI商業化的「奇點時刻」
    事實上,健康碼僅是疫情催化下人工智慧領域的眾多案例之一,諸如智能監控、無人配送、遠程貸款催收等一系列應用都在接連落地。不經意間,一場醞釀已久的AI商業化浪潮正在加速到來,而此時的我們,很可能正在度過一個歷史性的「奇點時刻」。
  • 「百度一下,你就知道」還是「百度一下,你就上當」?
    有句廣告語是這麼說的,「百度一下,你就知道」,然而,深圳市民易女士在手機上「百度」了一下,卻招來了騙子。
  • 解碼百度核心:移動的無色牆,AI的無形劍
    進而引出的下一個問題是,如果百度的核心業務在移動體系這邊,那麼頭條系大舉進軍搜索和百科,會不會撼動百度的產業根基?如果百度已經完全押注AI,那麼在槍手環伺的AI市場上,百度如何能確保長期的差異化與發展空間?
  • AI也有藝術創造力!B612咔嘰攜手百度大腦打造各式風格圖像
    「做一個關於美的傳播者」總能在某一刻成為所有人下意識的選擇,生發於社交媒體的「美」的傳播需求,也進一步催生人們源於個性表達下的「藝術性」嚮往。此時,人工智慧的入場恰逢其時。百度大腦圖像技術「圖像效果增強」功能恰可針對這樣的需求,支持個人及企業快速、大量並高還原地進行圖片修復、上色、風格遷移等。
  • 百度飛槳為AI獨立發展提供保障
    深度學習框架與晶片:人工智慧的軟硬基礎現階段,人工智慧技術高速發展,推動著全球科技革命和產業變革,人類社會正在大步邁向智能時代。深度學習是新一代人工智慧的關鍵技術,讓很多此前無法實現的AI應用在現實生活中「跑起來」。
  • 百度地圖亮相2020百度雲智峰會 AI新基建數字底座加速產業智能化
    12月17日,2020 ABC SUMMIT百度雲智峰會在北京中國大飯店舉行。本次大會廣邀來自不同行業的合作夥伴,分享產業智能化實踐成果,探討AI新基建下的產業機遇。作為AI新基建的重要數字底座,百度地圖攜智能物流、智能空間兩大解決方案及落地案例亮相智能產業專題論壇,依託多年積累的AI及大數據優勢,為物流、交通、城市建設等領域智能化升級提供科技支撐,全力加速產業智能化進程。
  • 免費計算資源,百度一站式開發平臺:AI Studio零門檻實現AI能力
    2018 年 7 月 4 日-5 日,百度在國家會議中心舉辦第二屆 AI 開發者大會。在今年的開發者大會上,百度發布了 PaddlePaddle3.0,既升級了核心框架,又提供了 EasyDL 快速應用平臺、AutoDL 網絡結構自動化設計,以及 AI Studio 在線實訓平臺。本文從功能簡介,實戰建模及 AI 能力應用等角度介紹了 AI Studio。
  • 孵化公司賣給蘋果、百度,艾倫人工智慧研究所到底是啥
    智東西(公眾號:zhidxcom)編 | 董溫淑智東西5月27日消息,今年1月份,蘋果收購了AI圖像識別初創公司Xnor.ai。消息人士稱收購金額為約2億美元(約合人民幣14億元)。2017年的百度開發者大會上,百度高調宣布全資收購自然語言處理公司Kitt.ai。數位化趨勢之下,各大巨頭向AI創企投出橄欖枝並不稀奇。
  • 2019百度的七個關鍵詞,跨入AI工業化大生產時代
    百度智能雲的技術、產品和服務能力持續得到市場權威機構認可,進入中國雲計算廠商第一陣營,推動越來越多行業進行智能化升級。不難看出,在「雲+AI」戰略指引下,百度AI正在深入農業、工業、金融、教育、醫療、傳媒等方方面面,讓人們的生活更美好。現在,讓我們用7個關鍵詞,一起看看百度AI的2019。
  • 百度天工喚醒萬物!AI+安全加持 智能物聯網現身2020雲智峰會
    5月18日,ABC SUMMIT 2020百度夏季雲智峰會在線上舉行。在百度智能雲一系列新戰略、新架構、新方案亮相之後,智能物聯網論壇成為產業各界關注的焦點。會上,百度副總裁馬傑與百度智能雲物聯網相關業務負責人及多位來自產業界的嘉賓一道,共同探討和分享了百度在物聯網領域的最新進展及百度天工物聯網平臺在眾多重要場景的實際應用案例。
  • AI 如何成為百度翻譯 DAU 高速增長的引擎?
    也是在剛剛過去的這個季度,百度旗下的翻譯產品百度翻譯獲得眾多關注。根據其官方透露的數字,2020 年第一季度,百度翻譯產品的 DAU(日活躍用戶數量)環比增長 10%,同比更是增長了 40%,在行業增長整體放緩的大環境下,百度翻譯實現了逆勢增長。
  • 「Bring AI to Life」,百度地圖因科技讓出行更簡單
    11月16日,2017百度世界大會在北京舉辦,「Bring AI to Life」的主題之下,百度AI開始向產品化落地。伴隨百度AI戰略的深入實施,百度地圖通過人工智慧技術在數據處理及大數據分析方面的應用,海量用戶數據的深層價值得以挖掘釋放,進而帶來更智能的體驗,更真實的場景,展現出更多可能性。