近日,谷歌(暫限於英文版谷歌)正式推出被稱為知識圖譜(Knowledge Graph)的新搜索功能。只要在谷歌搜尋引擎裡鍵入單詞或短語,在傳統搜索結果的右側就會多出一個欄目直接顯示該詞條的相關信息,這些信息來自維基百科與其他提供信息服務的網站。與之前的瀏覽方式相比,用戶免去了自己訪問信息出處網站這一過程——谷歌直接把信息呈現在搜索頁面中。
站在用戶的角度,谷歌的創新的確提供了更加快捷的搜索體驗——只需輕輕一敲,信息盡在眼前。不過需要點擊量的網站們聽到這個消息肯定開心不起來了。知識圖譜的出現給他們的生存帶來了威脅,甚至對現存網際網路產業的商業模式造成了衝擊。可以預測,知識圖譜將導致一系列網站關門,而網站的減少又將造成網絡信息的流失。信息是網絡的基石,谷歌此舉究竟會帶來什麼呢?
知識圖譜僅作為一項新功能,就已經收錄了約5億個詞條,信息量也已達到35億條,而且這個數據還在不斷地膨脹。對於一個語義搜尋引擎而言它的確足夠強大,老牌語義搜尋引擎維基百科只有3000萬個頁面,相比於谷歌足足少了一位數。功能推出後的谷歌搜索搜索結果分為左右兩個部分,左側是傳統的搜索結果,右側是知識圖譜功能提供的語義信息。
谷歌搜索布朗克斯動物園,在右側會出現動物園的相關信息
上圖為對美國布朗克斯動物園(Bronx Zoo)的搜索結果。在搜索結果新增的右側,谷歌給出了一張布朗克斯動物園的地理位置圖,地圖下方是對動物園的基本描述。描述的右下角標註了維基百科的連結,表示此條信息選取自維基百科。在基本描述之外谷歌還列出了布朗克斯動物園的一些玩點與看點。與傳統搜索結果中的第一條——動物園官方網站相比,這些信息還是略顯單薄。但對於那些沒有官方網站的詞條而言,這樣的信息應該算是很具參考價值的了。
在谷歌利用網際網路上的已有信息把自己打造為一個語義搜尋引擎之際,微軟的必應在做著另一方面的嘗試——把搜尋引擎和社交網站結合起來。必應試圖從用戶的社交網絡中提取信息以做出更加全面的回答。只要用戶登陸Facebook時激活必應的工具欄,必應便會從Facebook內的好友主頁中拉取信息,顯示在搜索結果中。比如用戶通過必應搜索某一景點,它就會顯示出好友相冊裡關於該景點的照片;搜索某一部電影,它就會顯示出好友對此影片的評論。不過這項功能還有待完善,有用戶反應自己在搜索地名時獲得的信息卻是「幾百年沒見的老朋友曾經居住在距離此地100英裡(約161公裡)外的地方」,而搜索印度泰姬陵景區時彈出的卻是名為「泰姬陵(Taj Mahal)」的音樂家最近新開了博客。
相比谷歌,必應的新搜索功能還是落在了後頭。它著眼的社交搜索功能不僅需要用戶在Facebook上有足夠數量的好友作為支持(好友數越多信息量越充足),而且暫時還無法給出令人滿意的結果。就搜索布朗克斯動物園為例,必應大概只能拉取出Facebook上好友在該地的照片,或是某某好友曾在紐約州(布朗克斯是紐約州的一個市區)居住過,這些都不具備足夠的參考意義。必應的另一個新功能是「諮詢親友」,當用戶進行搜索時可以選擇「諮詢親友」選項,向自己所有Facebook上的好友同時發問,不由得讓人想起了開心辭典。目前該功能也沒有完善,用戶只能向所有的好友一起發問,不允許主動選擇範圍人群。谷歌旗下也有「Google Circles」(由Google+發展而來)這一社交產品。對於谷歌是否也會發展出自己的「諮詢親友」功能還很難說,不過筆者相信,讓用戶有選擇諮詢對象的能力,是這項功能不變的核心。
谷歌也在把社交網絡與搜尋引擎相結合起來的方向做了嘗試,並推出了Search Plus Your World。和必應的社交搜索功能相比,它的不足點在於沒有把傳統網絡搜索結果和社交網絡搜索結果分列顯示,這給用戶造成了不必要的麻煩。有用戶有時只想搜索新內容,卻不得不在搜索結果中重溫社交網絡中的言語圖片。必應在此方面做得更好,它把兩者分而處之,給用戶提供了更大的自由空間。
回到谷歌知識圖譜對網際網路產業的衝擊這一話題。知識圖譜功能確實損害了信息來源網站的利益,谷歌正在把網絡上的信息一步步地搬到自己的資料庫中(正如它已經對維基百科進行的侵蝕與同化),用戶們逐漸不用再點擊信息來源網站進行訪問。而點擊量對於網站而言意味著價值,維基百科依賴著用戶的使用才獲取了關注及捐款。點擊量的下降必將導致網站提供信息量的下降,這種上層建築侵蝕下層基礎結構的不穩定性不用多說。如同觸尾即斃的貪吃蛇,問題遲早會浮出水面。
谷歌對於這個質疑也給出了自己的回答,谷歌搜索業務的高管艾米特·辛格爾(Amit Singhal)對此話題給出了回應。他指出,搜尋引擎的技術進步將擴大使用搜尋引擎的總人數,而擴大的用戶基數將給網站帶去更多的訪問量。辛格爾迴避了這樣一個事實:谷歌此次的新功能與他所言及的技術進步不同。之前谷歌在搜尋引擎上所做的努力在於如何將搜索結果定位到更加滿足用戶需求的網站,而現在他們改變了用戶習慣——用戶不用再去訪問網站了。所以無論這個基數有多大,網站方都不會看到自己想要看到的結果。
辛格爾還回應道,網站方與其指責搜尋引擎的進步,倒不如在自己身上下工夫,提升自己的價值,而不是只回答搜尋引擎就能搞定的問題。在他舉出的例子裡,這個「搜尋引擎就能回答的問題」是「2加2等於幾」。很明顯,谷歌和辛格爾都沒有在嚴肅地對待這個問題。至今沒有人能夠指出谷歌的邊界在哪裡,也許只有技術瓶頸能夠成為他們的障礙。不過這倒是給整個網際網路行業提了個醒——只要能提升自己的服務、為自己創造價值,谷歌絕不手軟。
用谷歌搜索「全球變暖」,右欄出現的是一個支持者和一個反對者。
假設谷歌的知識圖譜完全成熟,它將涵蓋地球上所有書籍以及網站上的內容信息。也就是說,它將具備信息壟斷的能力。屆時假設有一個網站對於「氣候變化」和「智慧財產權」這樣頗具爭論性的問題擁有一個不同於常的論點,此時用戶們使用谷歌的搜尋引擎就無法找到它。歷史經驗無數次告訴我們,一旦有機構能夠代表權威,它就有能力扼住信息的咽喉。
令人擔心的是,谷歌把自己定位為信息的權威方,而不是一個網際網路信息搬運工的角色。同時,它僅僅把這種權威的身份賦予自己——只有谷歌有能力對知識圖譜上的內容進行判斷和修改。老牌語義搜尋引擎維基百科對自己的定義是「自由的百科全書」,主張「動態、可自由訪問和編輯」的理念。但谷歌不是這麼想的,它把這扇門向公眾關閉了。
文章編譯自Extreamtech網站: Google’s Knowledge Graph: Wikipedia on steroids, or the beginning of the end for the web?
作者: David Cardinal