谷歌知識圖譜功能帶來的是什麼?

2020-11-22 果殼網

近日,谷歌(暫限於英文版谷歌)正式推出被稱為知識圖譜(Knowledge Graph)的新搜索功能。只要在谷歌搜尋引擎裡鍵入單詞或短語,在傳統搜索結果的右側就會多出一個欄目直接顯示該詞條的相關信息,這些信息來自維基百科與其他提供信息服務的網站。與之前的瀏覽方式相比,用戶免去了自己訪問信息出處網站這一過程——谷歌直接把信息呈現在搜索頁面中。

站在用戶的角度,谷歌的創新的確提供了更加快捷的搜索體驗——只需輕輕一敲,信息盡在眼前。不過需要點擊量的網站們聽到這個消息肯定開心不起來了。知識圖譜的出現給他們的生存帶來了威脅,甚至對現存網際網路產業的商業模式造成了衝擊。可以預測,知識圖譜將導致一系列網站關門,而網站的減少又將造成網絡信息的流失。信息是網絡的基石,谷歌此舉究竟會帶來什麼呢?

技術進步

知識圖譜僅作為一項新功能,就已經收錄了約5億個詞條,信息量也已達到35億條,而且這個數據還在不斷地膨脹。對於一個語義搜尋引擎而言它的確足夠強大,老牌語義搜尋引擎維基百科只有3000萬個頁面,相比於谷歌足足少了一位數。功能推出後的谷歌搜索搜索結果分為左右兩個部分,左側是傳統的搜索結果,右側是知識圖譜功能提供的語義信息。

谷歌搜索布朗克斯動物園,在右側會出現動物園的相關信息

上圖為對美國布朗克斯動物園(Bronx Zoo)的搜索結果。在搜索結果新增的右側,谷歌給出了一張布朗克斯動物園的地理位置圖,地圖下方是對動物園的基本描述。描述的右下角標註了維基百科的連結,表示此條信息選取自維基百科。在基本描述之外谷歌還列出了布朗克斯動物園的一些玩點與看點。與傳統搜索結果中的第一條——動物園官方網站相比,這些信息還是略顯單薄。但對於那些沒有官方網站的詞條而言,這樣的信息應該算是很具參考價值的了。

谷歌 vs. 必應:不同的發展之路

在谷歌利用網際網路上的已有信息把自己打造為一個語義搜尋引擎之際,微軟的必應在做著另一方面的嘗試——把搜尋引擎和社交網站結合起來。必應試圖從用戶的社交網絡中提取信息以做出更加全面的回答。只要用戶登陸Facebook時激活必應的工具欄,必應便會從Facebook內的好友主頁中拉取信息,顯示在搜索結果中。比如用戶通過必應搜索某一景點,它就會顯示出好友相冊裡關於該景點的照片;搜索某一部電影,它就會顯示出好友對此影片的評論。不過這項功能還有待完善,有用戶反應自己在搜索地名時獲得的信息卻是「幾百年沒見的老朋友曾經居住在距離此地100英裡(約161公裡)外的地方」,而搜索印度泰姬陵景區時彈出的卻是名為「泰姬陵(Taj Mahal)」的音樂家最近新開了博客。

相比谷歌,必應的新搜索功能還是落在了後頭。它著眼的社交搜索功能不僅需要用戶在Facebook上有足夠數量的好友作為支持(好友數越多信息量越充足),而且暫時還無法給出令人滿意的結果。就搜索布朗克斯動物園為例,必應大概只能拉取出Facebook上好友在該地的照片,或是某某好友曾在紐約州(布朗克斯是紐約州的一個市區)居住過,這些都不具備足夠的參考意義。必應的另一個新功能是「諮詢親友」,當用戶進行搜索時可以選擇「諮詢親友」選項,向自己所有Facebook上的好友同時發問,不由得讓人想起了開心辭典。目前該功能也沒有完善,用戶只能向所有的好友一起發問,不允許主動選擇範圍人群。谷歌旗下也有「Google Circles」(由Google+發展而來)這一社交產品。對於谷歌是否也會發展出自己的「諮詢親友」功能還很難說,不過筆者相信,讓用戶有選擇諮詢對象的能力,是這項功能不變的核心。

谷歌也在把社交網絡與搜尋引擎相結合起來的方向做了嘗試,並推出了Search Plus Your World。和必應的社交搜索功能相比,它的不足點在於沒有把傳統網絡搜索結果和社交網絡搜索結果分列顯示,這給用戶造成了不必要的麻煩。有用戶有時只想搜索新內容,卻不得不在搜索結果中重溫社交網絡中的言語圖片。必應在此方面做得更好,它把兩者分而處之,給用戶提供了更大的自由空間。

行業衝擊與信息壟斷

回到谷歌知識圖譜對網際網路產業的衝擊這一話題。知識圖譜功能確實損害了信息來源網站的利益,谷歌正在把網絡上的信息一步步地搬到自己的資料庫中(正如它已經對維基百科進行的侵蝕與同化),用戶們逐漸不用再點擊信息來源網站進行訪問。而點擊量對於網站而言意味著價值,維基百科依賴著用戶的使用才獲取了關注及捐款。點擊量的下降必將導致網站提供信息量的下降,這種上層建築侵蝕下層基礎結構的不穩定性不用多說。如同觸尾即斃的貪吃蛇,問題遲早會浮出水面。

谷歌對於這個質疑也給出了自己的回答,谷歌搜索業務的高管艾米特·辛格爾(Amit Singhal)對此話題給出了回應。他指出,搜尋引擎的技術進步將擴大使用搜尋引擎的總人數,而擴大的用戶基數將給網站帶去更多的訪問量。辛格爾迴避了這樣一個事實:谷歌此次的新功能與他所言及的技術進步不同。之前谷歌在搜尋引擎上所做的努力在於如何將搜索結果定位到更加滿足用戶需求的網站,而現在他們改變了用戶習慣——用戶不用再去訪問網站了。所以無論這個基數有多大,網站方都不會看到自己想要看到的結果。

辛格爾還回應道,網站方與其指責搜尋引擎的進步,倒不如在自己身上下工夫,提升自己的價值,而不是只回答搜尋引擎就能搞定的問題。在他舉出的例子裡,這個「搜尋引擎就能回答的問題」是「2加2等於幾」。很明顯,谷歌和辛格爾都沒有在嚴肅地對待這個問題。至今沒有人能夠指出谷歌的邊界在哪裡,也許只有技術瓶頸能夠成為他們的障礙。不過這倒是給整個網際網路行業提了個醒——只要能提升自己的服務、為自己創造價值,谷歌絕不手軟。

用谷歌搜索「全球變暖」,右欄出現的是一個支持者和一個反對者。

假設谷歌的知識圖譜完全成熟,它將涵蓋地球上所有書籍以及網站上的內容信息。也就是說,它將具備信息壟斷的能力。屆時假設有一個網站對於「氣候變化」和「智慧財產權」這樣頗具爭論性的問題擁有一個不同於常的論點,此時用戶們使用谷歌的搜尋引擎就無法找到它。歷史經驗無數次告訴我們,一旦有機構能夠代表權威,它就有能力扼住信息的咽喉。

令人擔心的是,谷歌把自己定位為信息的權威方,而不是一個網際網路信息搬運工的角色。同時,它僅僅把這種權威的身份賦予自己——只有谷歌有能力對知識圖譜上的內容進行判斷和修改。老牌語義搜尋引擎維基百科對自己的定義是「自由的百科全書」,主張「動態、可自由訪問和編輯」的理念。但谷歌不是這麼想的,它把這扇門向公眾關閉了。


文章編譯自Extreamtech網站: Google’s Knowledge Graph: Wikipedia on steroids, or the beginning of the end for the web?

作者: David Cardinal

相關焦點

  • 究竟知識圖譜是什麼?它又與人工智慧有著怎樣的聯繫呢?
    在百度新春內部演講中,李彥宏說,「知識圖譜(包括需求圖譜、用戶畫像等等),這些東西都是百度整個人工智慧當中非常基礎的構件,也是我們相對於其他任何一家公司的優勢所在。」在AI World 世界人工智慧大會上,百度副總裁、AI技術平臺體系(AIG)總負責人王海峰也避開萬眾矚目的眾多熱詞,將重心聚焦於知識圖譜上。 除了百度,谷歌、阿里、華為等玩家也在積極部署知識圖譜。
  • 試驗知識圖譜分析
    、知識圖譜方面的應用研究。前言:知識圖譜是知識工程不斷發展衍生出的新一代知識工程技術,知識圖譜的概念最早是由谷歌在2012年正式提出,最初僅應用在智能搜索領域,目前已應用在多垂直領域,比如金融行業、醫療衛生、政府、能源與工業得到廣泛的應用。本期課程重點分為以下四個方面:試驗知識綜述、試驗知識圖譜分析、試驗知識圖譜構建技術和試驗知識圖譜技術展望。
  • Data Fabrics與知識圖譜之間的共生關係
    亞馬遜的知識圖譜保留了關於其龐大產品陣列的元數據,谷歌的知識圖譜能捕捉到網絡用戶興趣愛好的詳盡數據。那些相對不太出名的公司也都部署了這些機制來處理公司的一切事務,從全面的客戶評估到生產流程。Datafabrics 與知識圖譜的運行有著獨特的共生關係。
  • 知識圖譜構建的研究已走入下半場,但大規模落地應用仍需時間
    這一年,谷歌發布了 570 億實體的大規模知識圖譜,其宣傳語是「Things, not Strings」給出了知識圖譜的精髓,即,不要無意義的字符串,而是獲取字符串背後隱含的對象或事物,多組研究者也曾獨立地提出過相似的理論。
  • 如何構建知識圖譜?
    本文根據轉轉張青楠老師,在DataFun AI+ Talk中所分享的《二手電商知識圖譜構建以及在價格模型中的應用》編輯整理而成。一、知識圖譜概述這次的分享主要從以下四個部分:知識圖譜概述、知識圖譜構造、轉轉二手電商知識圖譜、在價格模型中的應用。
  • 是時候該關注「知識圖譜」了!
    知識圖譜是什麼通俗地講,知識圖譜就是將複雜的知識通過數據挖掘、信息處理、知識計量和圖形繪製等一系列方式,把所有不同種類的信息連接在一起得到的一個關係網絡。在知識圖譜裡,用節點表示現實世界中存在的「實體」,用邊示意實體與實體之間的「關係」。
  • 本體和知識圖譜之間的區別是什麼?
    隨著語義應用程式成為業界越來越熱門的話題,客戶經常來EK詢問有關本體和知識圖譜的問題。具體來說,他們想知道兩者之間的區別。本體和知識圖譜是一回事嗎?它們有何不同?兩者之間是什麼關係?在這篇博客中,我將引導您了解本體和知識知識圖譜,講述它們之間的區別以及它們如何組織大量數據和信息。 什麼是本體?
  • 解析|如何構建知識圖譜
    知識圖譜,讓用戶能夠查詢到更多潛在內容,為組織節省了大量的知識重複和調閱工作,提升隱形競爭力。 本文,將從知識圖譜概念和應用兩個角度,幫助看到的您,了解熟悉知識圖譜工具,為工作過程降本增效提供新的選擇。
  • AI知識圖譜,讓我擼到了一隻「天山上的雪豹」
    知識圖譜自帶語義、蘊涵邏輯含義和規則:結點對應現實世界中的實體或者概念,每條邊或屬性也對應現實中的一條知識;可以根據人類定義的規則,推導出知識圖譜數據中沒有明確給出的知識。那麼回到「神秘雪豹在哪裡」,知識圖譜是如何具體實現其功能的呢?
  • 基於向量空間的知識圖譜查詢及結果解釋
    知識圖譜是一個宏大的數據模型,可以構建龐大的「知識」網絡,包含世間萬物構成的「實體」以及它們之間的「關係」,圖文並茂地展現知識方方面面地「屬性」,讓人們更便捷地獲取信息、找到所求。為了讓大家對知識圖譜有更深入的認識,今天這篇文章將由東南大學計算機科學與工程學院王萌老師為我們講解基於向量空間的知識圖譜查詢及結果解釋。
  • 晉梅:金融知識圖譜的應用探索
    在首都金融創新與發展公開課的第四模塊「金融科技創新與賦能」中,我們非常榮幸邀請到了頂象首席金融風控專家晉梅做客直播間,帶來《金融知識圖譜的應用探索》主題分享。在日常生活中,知識圖譜的應用廣泛滲透到C端用戶生活的方方面面。比如智能搜索,實際上「知識圖譜」概念最早由谷歌在2012年提出,它能夠在反饋正確結果、給出全面總結、更深入廣泛探索三大方面提高搜索效果。
  • 深度解析知識圖譜領域幾次發展的主要技術突破
    他是中國中文信息學會語言與知識計算專委會委員,W3C 顧問委員會委員,中國計算機協會會刊編委,中文開放知識圖譜聯盟(OpenKG)發起人之一。他的研究領域涉及人工智慧諸多方向,如自然語言處理、語義網、機器學習、描述邏輯、資訊理論、神經網絡、圖像識別等,已發表 70 多篇論文。 ▌什麼是知識圖譜? 知識圖譜到底是什麼?
  • 領域大數據知識圖譜專題 《中國科學:信息科學》
    自2012年穀歌推出基於知識圖譜的搜尋引擎以來,知識圖譜在工業、商業、金融、醫療、教育、諮詢等領域都得以不斷應用,並取得了初步的效果。由於不同領域在數據特點、領域需求上具有較大差別,面向領域的大數據知識圖譜仍面臨諸多問題及挑戰。
  • YOCSEF合肥技術論壇:知識圖譜是否真的物有所值
    10月10號,YOCSEF合肥技術論壇成功在線召開,本次主題圍繞知識圖譜是否真的物有所值展開。知識圖譜是近年來的研究和應用熱點,已經進入其蓬勃發展的階段,並且逐步輻射眾多行業。但是知識圖譜成本高昂,能否獲得相對應的增益,達到物有所值的目的仍舊是值得探討的問題。
  • 知識圖譜在推薦系統的落地
    原標題:知識圖譜在推薦系統的落地 本篇文章為大家介紹了什麼是推薦系統、推薦系統運作流程、圖譜應用的優勢、圖譜在推薦中的應用、圖譜推薦的原理、圖譜推薦的難點,並附上實際例子幫助大家進一步了解。
  • 知識圖譜在金融資管領域的應用、實踐與展望
    知識圖譜是人工智慧的一個重要分支,對可解釋人工智慧具有重要作用。金融知識圖譜作為專業領域知識圖譜,在智能投研、智能風控、智能客服、智能合規等領域有著重要的應用價值。本文綜合熵簡科技三年以來的產業實踐,結合知識圖譜領域的技術前沿,以及資管場景的落地應用,淺談知識圖譜在金融資管領域的發展現狀與應用展望。
  • 知識圖譜的皇冠:知識圖譜推理的前世今生
    [ 導讀 ]業界和學界對知識圖譜的關注主要集中於兩大領域,分別是知識圖譜的構建和知識圖譜的應用。 前者聚焦於通過對結構化、非結構化數據的整合,實現統一形式的數據存儲;後者則著眼於通過算法對海量知識圖譜數據進行學習與挖掘,從而推理出新的知識,服務於具體行業應用。
  • 愛分析·中國知識圖譜應用趨勢報告
    1.1.2知識圖譜發展歷程  谷歌於2012年正式提出知識圖譜(Knowledge Graph)概念,並應用在智能搜索領域。知識圖譜(Knowledge Graph)本質是以圖的形式表現實體(概念、事物、人)及其關係的知識庫,可看作有向圖結構的網絡。目前,知識圖譜技術已在智能搜索、智能問答、網絡分析、決策輔助、推薦系統等領域廣泛應用。
  • AI教育華而不實,「知識圖譜」玩法能救場嗎?
    以一個圖直觀感受下,在科大訊飛的知識圖譜中,數理化各取一章節某一小節的知識圖譜合在一起成為下圖:不同學科、不同章節、不同小節……「知識圖譜」的底圖無疑將是龐大的傳統AI教育產品也試圖解決讓家長痛苦、學生焦慮的聽不懂、說不準問題,配套有諸如跟讀、評分等功能。然而,由於英語聽說的某種感性化屬性(流暢度、發音、自然情感等),不同的產品對學生學習成果如何的評判標準是不同的。什麼才是正確的「標準」?——解決了這個問題,有限的訓練才能有的放矢。
  • 谷歌圖片搜索可顯示上下文信息
    當你下一次使用谷歌搜索並點擊圖片時,可能會看到一些與圖片內容相關的有用信息了。谷歌現在正在將其知識圖譜(Knowledge Graph)與網上找到的圖片進行更深入的整合。如果你曾經搜索過某個東西,並看到主界面一側的面板上顯示了一些與你的查詢相關的事物,那麼你就已經看到了知識圖譜的具體作用。谷歌早在 2012 年就首次推出了這個資料庫,從那時起,它已經擴大到包括大約 5000 億個事件,與 50 億個條目相關。不過,確保搜索將圖像與事件精準相連是一件棘手的任務。