谷歌發布全新檢索引擎:搜書從未如此方便-谷歌,發布,檢索引擎,搜書...

2020-12-14 快科技

昨日,谷歌分享了 Semantic Experiences,在博客中展示了兩大關於自然語言理解的互動工具。Talk to Books 是一個可以從書中的句子層面搜索書籍的全新檢索模式;另一個互動內容則是 Semantris,一個由機器學習驅動的單詞聯想遊戲。

雷鋒網了解到,谷歌還發布了「通用語句編碼器」(Universal Sentence Encoder),更加詳細地呈現了上述示例所使用的模型;當然,谷歌還為開源社區提供了一個預訓練的 TensorFlow 模型,開發者可以測試自己的句子及短語編碼。

自然語言理解在近年已經有了極大進步,這得益於詞向量(word vectors)的發展,這一技術使算法能根據實際語言使用的例子來學習單詞之間的關係。這些向量模型根據概念和語言的等價性、相似性或關聯性,將語義相似的詞或短語投影到臨近點。

建模方法

谷歌拓展了在向量空間中表徵語言(language)的構想,這一想法通過為像完整句子或段落為代表的較大語言塊創建向量來實現。語言是由具有概念的層次結構組成的,因此團隊採用模塊的層次結構來構建向量,每一模塊都要考慮與不同時間尺度序列所對應的特徵。

各種類型的關係,如關聯、同/反義、部分/整體等都可以用向量空間語言表示。團隊在論文《Efficient Natural Language Response for Smart Reply》有更多介紹。

Talk to Books

以往我們在檢索書籍時,通常會從書名、作者、主題等表面標籤入手。而谷歌發布的「Talk to Books」可以為用戶提供一種檢索書籍的全新方法。用戶只需要做一段相關描述,或是提一個相關的問題,那麼 Talk to Books 可以在不依賴關鍵詞匹配的情況下,從超過 10 萬本書籍中檢索所有句子,並根據句子層面的語義,找到能匹配用戶陳述或問題的句子。

從某種意義上來說,Talk to Books 是一種用戶與書「交談」的新模式,系統給出的回答也能幫助用戶確定自己是否對相關主題感興趣。

模型在正式發布前經歷了超十億次的對話訓練,以打磨更好的用戶體驗——對用戶的提問或陳述給出更加合適的回答。這一方式相比起普通的谷歌檢索,可能會幫助用戶找到一些更有趣的書籍,特別是在關鍵字搜索中並不會顯示的一些結果。

不過,這一模型還有更多的改進空間,比如搜索範圍局限在句子層面上,而不是段落,因此可能會產生「斷章取義」的情況。另外,因為只看某一句子的匹配程度,這也可能導致某些眾所周知的、「符合口味」的書並不會出現在檢索結果的前列。

谷歌團隊此舉,更多的是希望幫助人們以一種新的探索方式,發現不曾料想過的作者和書名,竟然會有讀者感興趣的內容。

地址:https://books.google.com/talktobooks

Semantris

Semantris 是一個由相同技術驅動的單詞聯想遊戲。屏幕上會呈現所有單詞,用戶可以輸入某個單詞,隨即系統會根據屏幕上單詞與用戶輸入單詞的關聯程度進行重新排序。不論是近義詞、反義詞還是相近概念,系統都能找到對應的排序模式。

如圖所示,用戶輸入「Photo」時,最頂部的「Camara」因為與輸入單詞的關聯最為緊密,因此會更替排序調整到第一位「消掉」。這確實是一個鍛鍊聯想能力的好機會,此外還有限時模式和不限時模式供用戶體驗。

地址:https://research.google.com/semantris

相信在這兩個工具的驅動下,人工智慧能夠與用戶更好地進行交互學習,並且幫助人類在現實生活中更好地理解科技,使用科技,並受惠於科技。

相關焦點

  • 谷歌發布「與書對話」檢索引擎,從字裡行間邂逅心儀書籍
    Talk to Books 是一個可以從書中的句子層面搜索書籍的全新檢索模式;另一個互動內容則是 Semantris,一個由機器學習驅動的單詞聯想遊戲。地址:https://research.google.com/semanticexperiences/雷鋒網了解到,谷歌還發布了「通用語句編碼器」(Universal Sentence Encoder),更加詳細地呈現了上述示例所使用的模型;當然,谷歌還為開源社區提供了一個預訓練的 TensorFlow 模型,開發者可以測試自己的句子及短語編碼。
  • 史上最全的中外文獻檢索網站!
    中文文獻檢索(一)中文圖書1.鳩摩搜書:https://www.jiumodiary.com/>(各類網盤,外鏈網站檢索)2.讀秀:http://www.duxiu.com/ (唯一檢索到書的內容的強大引擎!)
  • 谷歌金山詞霸1.8正式推出 整合谷歌翻譯引擎
    摘要:       9月28日消息,金山今日發布了全新的谷歌金山詞霸1.8版本,其中整合進谷歌翻譯引擎實現劃詞翻譯,但在盈利模式上並未進行明顯的探索。
  • 方正推出「搜書網」
    日前,方正聯合全國百家知名出版單位,推出圖書搜尋引擎――搜書網,以「搜書、翻閱、導購」三大特色功能為讀者提供全面的中文圖書信息與導購服務,包括電子書翻閱、紙書和電子書書目信息、購買渠道及價格信息等。搜書網構建在當前中國最大的正版電子圖書資源庫之上,源自全國出版界與方正四年來共同推進網絡出版的成功積累。
  • 改進輸入法引擎 谷歌拼音2.2正式版發布
    在拼音輸入法領域,搜狗和QQ拼音以及老牌的紫光,永遠都有說不完的話題,對於後來的谷歌拼音來說,從誕生到現在雖然市場佔有率並沒有迅速的增長,不過谷歌拼音輸入法憑藉其堅實的後盾也在不斷的完善和改進中,逐步建立其良好的口碑。谷歌拼音2.0可謂是革命性的改進,全新的輸入法設置嚮導,默認輸入界面也進行了調整,增強了立體感,看起來更加美觀。
  • 「谷歌」開設日文版書籍檢索網站
    首頁 > 動態 > 關鍵詞 > 谷歌最新資訊 > 正文 「谷歌」開設日文版書籍檢索網站
  • 谷歌推出AI研發搜尋引擎
    來源:科技日報9月5日,谷歌發布了一個幫助研究者查找在線數據的免費搜尋引擎:數據集搜索(Dataset Search)。谷歌表示,該引擎面向科學家、數據記者、數據極客等人群。據搜狐科技報導,數據集搜索與谷歌的其他專用搜尋引擎一樣可以免費使用,它基於擁有者對文件和資料庫的分類方式來查找文件和數據集。該引擎讀取文件內容的方式與搜尋引擎搜索網頁的方式不同。有專家表示,該引擎填補了這一領域的空白,可以極大地促進開放數據運動的發展,這一運動旨在實現數據的開放利用和重複利用。
  • 許昌市圖書館:「趣味搜書」,10秒找到你需要的書
    許昌市圖書館的館藏圖書很多,要在眾多的圖書中找到你需要的,可能要費點時間,不過現在圖書館推出了「趣味搜書」,10秒鐘就能搞定。許昌市圖書館工作人員 劉星:我們這兒每本書都實行了定位,像每本書上都有它的信息,相當於(書本身)的身份證,如果你知道這本書的名字或者任何編碼,你就可以在我們的查詢機上檢索,立刻找到你所需要的書。
  • 愛書的你怎麼能不知道這幾款搜書網站呢
    電子書除了特別喜歡的書籍我們可能會購買,大部分同學還是喜歡網站找大家分享版本,現在小編就介紹幾個搜書網站,供大家參考。書籍是人類進步的階梯,圖片來自網絡一、鳩摩搜書鳩摩搜書採用最新的大數據搜索,可以對國內外各種電子書資源進行掃描查詢
  • 緊跟中國搜尋引擎的腳步,谷歌也要做信息流了
    2014年時任谷歌CEO的拉裡·佩奇(Larry Page)就曾表示「組織全球信息」這個使命已經完成了,當時谷歌並未明確新的使命是什麼,谷歌顯然未曾料到組織全球信息還有信息流這樣的新方式。五年前搜索業界就有一種觀點,那就是下一代搜尋引擎是推薦引擎,即「不搜即得」的搜索,基於用戶歷史數據進行個性化推薦。
  • 谷歌發布新地圖引擎API 可個性化定製
    Google近日宣布正式發布新的Google地圖引擎 API,將允許企業開發者把自身的個性化數據傳到地圖引擎上,和 Google 地圖原本的數據一起,整合在應用裡。Google 過去已經有地圖 API,但這普通的地圖 API 更多關注的是讓開發者能接入 Google 現有的地圖數據。
  • 谷歌拼音輸入法(測試版) V2.0 發布
    感謝匿名人士的投遞引擎升級、個性輸入、內嵌編輯、儀表顯示、節日徽標。
  • 搜書神器小說閱讀
    搜書神器小說閱讀 資訊閱讀 大小: 1.94M
  • 國外資料庫的檢索方法
    ,這樣,ERIC就不會單獨檢索專有名詞中的任意一個或者多個名詞,大大的提高了檢索的效率。關鍵詞與敘詞的區別在於關鍵詞是非規範化的,是自然語言,其優點是便於計算機檢索系統的應用,能準確檢索到許多新概念方面的文獻;缺點是因為關鍵詞是作者自己選定的,詞的形式不同,拼法不同或各近義詞、同義詞等容易造成文獻分散在各不同關鍵詞之中,不能集中。顯而易見,使用關鍵詞進行檢索比使用敘詞進行檢索的效率要低,很難得到更準確的相關研究文獻。要浪費很多時間進行多個關鍵詞的檢索才能得到更全面的信息。
  • 【文獻檢索】42種網絡學術搜尋引擎大全
    http://xueshu.baidu.com/ 【不服的可以比較比較谷歌的】2011年6月初,「百度學術搜索」上線,後來沉淪過貌似,前幾天改頭換面重新出世,重大變革。收錄國內外學術站點超過70萬家,如中文學術站點知網、萬方、維普,外文學術站點acm、IEEE、springer等,共計收錄中外文學術資源總量逾2億,中文超1.5億,外文超1億,讓學術搜索「一鍵直達」。
  • 中國搜尋引擎往事
    2006年3月,騰訊發布SOSO(搜搜)。2006年4月,谷歌中國正式成立。2006年12月,網易推出有道搜索測試版。2009年5月,微軟公司推出Bing(必應)搜索。2010年3月,谷歌搜索退出中國大陸市場。2011年2月,由新華社和中國移動聯手打造的搜尋引擎盤古搜索上線。
  • 「分享」國外主流搜尋引擎大全
    6、rambler[俄](https://www.rambler.ru/)是由俄羅斯門戶網站Rambler旗下的一個搜索項目,搜尋引擎是由谷歌提供支持,並整合了本身的內容資源,除了加強了自身的內容搜索外,搜索結果和谷歌搜索結果沒有太大的詫異。Rambler 搜尋引擎不被屏蔽。
  • Android版本YouTube客戶端嘗試引入谷歌搜尋引擎的結果
    [PConline資訊]繼近日在Android版YouTube客戶端中引入避免熬夜的「就寢提醒」功能之後,Google現又嘗試為其引入來自谷歌搜尋引擎的推薦內容。如下方截圖所示,Android版YouTube客戶端已能夠顯示除站內視頻之外的谷歌搜尋引擎結果。YouTube客戶端中展示了來自Web的谷歌搜索結果如果對YouTube默認檢索到的內容感到不滿意,用戶還可點擊卡片式的底部連接,以選擇在Google上檢索相同的關鍵詞。
  • Android版YouTube客戶端嘗試引入谷歌搜尋引擎的結果
    繼近日在 Android 版 YouTube 客戶端中引入避免熬夜的「就寢提醒」功能之後,Google 現又嘗試為其引入來自谷歌搜尋引擎的推薦內容。如下方截圖所示,Android 版 YouTube 客戶端已能夠顯示除站內視頻之外的谷歌搜尋引擎結果。