谷歌表示它已經改善了其搜尋引擎理解同義詞的方式

2021-01-09 INeng財經

谷歌1月19日表示,它已經改善了其搜尋引擎理解同義詞的方式,這是該公司努力使搜索服務更像人類或人工智慧那樣以計算機行業的眼光來看的重要一步。解析同義詞是Hakia,Yebol和Microsoft的Powerset(現在為Bing提供動力)之類的搜尋引擎創業公司也在語義搜索的旗幟下開展的工作。這個想法是對搜尋引擎進行微調,以區分具有相似含義的單詞。

谷歌搜索質量的工程師已經超過五年的研究,導致該公司的「同義詞系統」,其中更折磨了「分析同義詞影響和質量,」在寫的谷歌軟體工程師史蒂芬·貝克的博客文章1月19日 「我們的系統分析PB級的Web文檔和歷史搜索數據」,以了解「不同上下文中的單詞含義」。

貝克說,該公司發現「同義詞在Google支持的100多種語言中影響了70%的用戶搜索」。

他說:「使計算機能夠理解語言仍然是人工智慧中最困難的問題之一。」 「搜尋引擎的目標是為您的搜索返回最佳結果,理解語言對於返回最佳結果至關重要。其中的關鍵部分是我們的同義詞理解系統。」

貝克說,人工智慧挑戰的一個很好的例子是幫助谷歌的搜尋引擎區分「圖片」和「照片」這兩個詞,它們通常是同一回事。

如果用戶搜索「用咖啡製成的照片」以查看如何使用咖啡粉作為顯影劑來顯影照片,則Google必須理解,即使頁面上顯示的是「照片」而不是「照片」,它仍然與搜索相關」,貝克說。請參閱此處的示例。

Google現在還在其搜索結果摘要中以粗體字母顯示搜索同義詞,以幫助搜索用戶了解顯示該結果的原因,即使該結果不包含原始搜索字詞也是如此。例如,對於「用咖啡衝印的照片」搜索,第一個結果的標題的單詞「 photos」以粗體顯示。

這是一個簡單的例子。谷歌還指出了涉及可能具有更複雜的同義詞的術語的查詢,例如「 GM」。請在此處查看Google對術語的解析。正如貝克所說:

「大多數人都知道最主要的含義:通用汽車。對於[通用汽車]的搜索,您可以看到Google在搜索結果中加粗了「通用汽車」的字樣。這表明,對於該搜索,我們認為「通用汽車」 」的含義與「 GM」相同。...GM可以表示[GM大學]中的George Mason,[GM Screen Star Wars]中的遊戲管理員,[GM College]中的Gangadhar Meher,[nba gm]總經理,甚至[海軍通用]的槍手隊友。」

Google處理同義詞的準確性如何?貝克說:「每50個使用同義詞可以顯著改善搜索結果的查詢中,[Google]只有一個真正糟糕的同義詞。」

同時,偶然發現不良同義詞的用戶應該了解幾件事。一是同義詞背後的AI並不完美,二是Google不會手動修復錯誤的同義詞,因為它傾向於對其搜索算法進行迭代改進。

Baker邀請了用戶在網絡搜索幫助中心論壇上發布問題,或者通過Twitter將其發送給井號#googlesyns。用戶還可以通過在特定術語之前添加「 +」或將這些單詞放在引號中來關閉特定術語的同義詞。

谷歌的搜索質量工程師之一馬特·卡茨(Matt Cutts)歡呼貝克的帖子,並呼籲谷歌為其搜索質量工作提供更多的透明度。他還放棄了挑戰挑戰兵的競爭者,例如必應,並指出:

「事實是,谷歌比大多數人意識到的要複雜得多。我想說的是,谷歌在「語義學」上做得更多,對文檔和查詢的理解比幾乎任何其他搜尋引擎都要多。」

相關焦點

  • 谷歌升級搜尋引擎技術:更好地理解自然語言,而不僅是關鍵詞
    站長之家(ChinaZ.com) 10月25日 消息:目前,谷歌已經對搜尋引擎背後的技術進行升級據cnet報導,谷歌今天稱,公司正更新搜尋引擎工具以改善對自然語言的分析,這將讓有助於用戶用自己語言進行搜索查詢。也就是,用戶可以按照自己現實生活中的說話方式進行查詢,而不需要輸入他們認為軟體更容易理解的關鍵詞/字符串進行搜索。對此,谷歌副總裁Pandu Nayak表示,網絡搜索在最近五年得到了質的飛躍,也是搜索歷史上變化最大的幾年。
  • 搜尋引擎處理同義詞的幾個方法
    當我們有相關的查詢需求時,搜尋引擎開始通過一些列算法調用搜索結果中的相關數據反饋,其中一個特別重要的問題就是seo工作人員經常忽略網站關鍵詞列表中的同義詞,這也是一些seo培訓課程,經常被忽略。那麼,搜尋引擎如何處理同義詞呢?
  • 谷歌剛剛在其搜尋引擎上增加了50個新的動物
    打開APP 谷歌剛剛在其搜尋引擎上增加了50個新的動物 新智元 發表於 2020-12-23 11:34:31 谷歌從去年開始在其搜索中顯示3D動物,最近,又增加了50種動物,除了小熊貓和貓,還有長頸鹿、牛、斑馬、豬和河馬等。
  • 谷歌Talk to books引爆搜索方式革命
    新智元專欄 作者:鄧侃【新智元導讀】 昨天, 新智元介紹了谷歌的全新搜索工具「 Talk to Books 」 , 基於自然語言文本理解, 用戶能夠憑語義而非關鍵詞來實現搜索功能。谷歌搜索的「AI化」令人眼前一亮, 谷歌是否即將從當今的搜尋引擎,革命性地進化到了回答引擎? 本文作者,大數醫達創始人、CMU 博士鄧侃對谷歌的這個新搜索工具的技術原理進行了解讀。今天讀到一則新聞,「 谷歌發大招:搜索全面AI化,不用關鍵詞就能輕鬆撩書 」。
  • 走進全球最大搜尋引擎總部 看谷歌如何盈利
    谷歌衛生間的門上都掛著數學題,這裡的工程師們就算是在方便的時候都無法停止思考。  谷歌總裁埃裡克·施密特說:「這裡吸引了許多有聰明才智的人。」據他介紹,谷歌每周都會新錄用100多人,這是推動谷歌這臺機器發展壯大的唯一途徑。德勤公司發布的報告顯示,谷歌是有史以來發展最快的企業,其收益在5年內增長了437%,從1999年的不到20萬美元增長到2003年的9.6億美元。
  • 搜尋引擎Yandex稱Google Docs任意可被索引 谷歌否認
    (原標題:俄羅斯搜尋引擎Yandex稱Google Docs任意可被索引 谷歌否認)
  • 作為搜尋引擎,谷歌在中國為什麼競爭不過百度?
    還記得可以用谷歌的那個年代嗎,小編就是親身經歷者。但好端端的谷歌為什麼突然就從中國消失了呢?谷歌簡介:Google成立於1997年,幾年間迅速發展成為目前規模最大的搜尋引擎,並向Yahoo、AOL等其他目錄索引和搜尋引擎提供後臺網頁查詢服務。目前Google每天處理的搜索請求已達2億次!
  • 蘋果為什麼要研發自己的搜尋引擎來對抗谷歌?
    蘋果的搜尋引擎很可能會與谷歌、必應和DuckDuckGo等其他搜尋引擎的外觀和功能有所不同。這可能是因為蘋果歷來喜歡以不同的方式做事,相比顯示廣告和數據挖掘,蘋果的搜尋引擎可能有著更為不同的目的。蘋果搜尋引擎將作為一個高度個性化的數據中心發揮作用。
  • 谷歌取代Yandex成俄版Firefox默認搜尋引擎
    替換為全球版本默認的谷歌搜索。  根據The Next Web透露,Yandex是俄羅斯最大的搜尋引擎,擁有接近60%的市場佔有率,而谷歌在俄羅斯市場的佔有率僅為26.5%。自2009年起Yandex就一直是Firefox的默認選項,同時Yandex也是當地人們最喜愛的搜尋引擎。
  • 蘋果正在研發的搜尋引擎能幹的過谷歌嗎?
    12月22日 消息:據TNW報導,蘋果正在加快研發自己的搜尋引擎,以取代谷歌。推出自己的搜尋引擎,將有利於蘋果的產品服務的推廣,同時削弱谷歌在搜索領域的壟斷地位。迫於監管層的壓力及自身發展的考慮,蘋果推出自己的搜尋引擎已成為順理成章之事。據了解,早在2018年,蘋果就已經開始布局自身搜尋引擎的打造。蘋果進入搜尋引擎市場的時間正值必應(Bing)發布11年。儘管微軟的PR團隊聲稱必應在經濟表現和市場支配力方面無法與谷歌相比,但必應依然是迄今為止,谷歌唯一值得關注的競爭對手。而如今,蘋果也加入了「戰局」。
  • 搜尋引擎的工作原理:了解抓取工具所需的一切
    早在1996年,兩名史丹福大學博士就提出了一種新型的搜尋引擎。拉裡·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)認為,基於頁面之間的關係對結果進行排名會更好,而不是根據關鍵字在網頁上出現的次數對結果進行排名。他們稱其想法為「 BackRub」,因為它基於反向連結對搜索結果進行排名。
  • 營收1000億美元 谷歌搜尋引擎要被告了:破壞競爭
    谷歌靠搜尋引擎起家,現在要惹上麻煩了,美國很快就要對他們在搜尋引擎上的壟斷採取法律行動。谷歌的搜尋引擎是很多人離不開的,尋找網頁和資料必不可少,它也給谷歌帶來巨額利潤,每年貢獻1000億美元營收,佔據美國市場90%的份額。
  • Google反對人們把它當作搜索的同義詞
    計世網8月17日消息,網際網路搜索巨頭Google表示,它將打擊把它的名稱當作普通動詞的做法,例如在「Google某人」的短語中把Google當作了搜索的同義詞。Google稱,這種做法可能損害其品牌。
  • 誰說程式設計師只能用谷歌?Bing 與 SyntaxDB 要成為更好的代碼搜尋引擎
    當用戶點擊某個概念的連結,其定義、syntax、相關註解以及案例會展示出來。與 HackerRank 的聯姻後的必應這帶來學習程式語言、玩代碼的新方式。「但現在,你有了一個更為順暢的新選擇——它不僅能『吐出』你需要的代碼答案,還能實時編輯、擺弄代碼。這不需要任何 IDE 安裝,能節省你以往浪費在搜索頁面和代碼編輯器之間來回切換的時間。現在,代碼在必應搜尋引擎的實時編輯器運行。
  • 谷歌發布AI搜尋引擎「Talk to Books」,不用關鍵詞也能「撩書」
    作為搜尋引擎起家的科技巨頭,谷歌曾推出過很多有意思的搜索工具。昨天,這家公司的研究機構發布了一款基於人工智慧的搜尋引擎,該實驗項目可以讓普通人也能感受最新語義理解和自然語言處理技術的強大能力:它們是目前人工智慧技術發展的重要方向。
  • 谷歌令人又愛又恨,搜尋引擎3.0時代能否變得更好?
    以谷歌為例,從零點到早上六點,谷歌已經實現了58億次搜索,足以證明需求之大。眾所周知,在數字領域,搜索和空氣一樣重要。沒有搜索,網際網路就是一個巨大的、動態的、混亂的、充滿著人類無法破譯甚至無法找到的信息的網絡。
  • 外貿人怎樣理解谷歌SEO?
    首先,我們先了解什麼是GoogleSEO GoogleSEO,也就是Google搜尋引擎優化(Search Engine Optimization,簡稱SEO) 是指在谷歌搜尋引擎上優化網站排名
  • 谷歌推出數據集搜尋引擎,可支持中文搜索
    谷歌數據集搜索地址:https://toolbox.google.com/datasetsearch圖丨谷歌數據集搜索(圖源:DT 君)此前,谷歌在今年 7 月推出的數據集標記架構,能夠提取用戶搜索結果中的數據,讓用戶更直觀的看到經過可視化處理的結果
  • 華為進軍搜尋引擎,這是要和谷歌正面剛?
    大家都知道搜尋引擎對企業意味著什麼,谷歌憑此成了世界搜尋引擎霸主,僅廣告費就能給谷歌帶來上千億的收入,這種誘惑應該沒人能拒絕。前幾天,華為就在海外上線測試了自家的搜索App HUAWEI Search,今後應該會作為華為生態系統的一部分推出。
  • 陷入過濾器泡沫:如何最好地使用搜尋引擎
    (北青網訊)像谷歌這樣的搜尋引擎只需要幾秒鐘就能找到信息,並且已經成為我們日常生活的一部分。 但是根據他們收集的數據,搜索結果是高度個性化的。從前,有字典,書籍,雜誌和電話。 但是現在,當你需要查找吉爾吉斯斯坦首都或奶酪蛋糕食譜時,有一個網際網路搜尋引擎。搜尋引擎對於用戶獲得什麼樣的信息有著巨大的影響。