Google 近日發布了一個語義體驗網站(Semantic Experiences),裡面有一個全新的書籍搜尋引擎和兩個基於機器學習的單詞遊戲。
新書籍搜尋引擎名為 Talk to Books。通常需要搜索一本書時,我們會輸入書名、作者、或者對內容的一個大概描述,得到的搜索結果是一長串書名、作者和內文預覽列表。在 Talk to Books 裡,輸入以上搜索關鍵詞,搜索結果會先顯示書籍段落中對這些詞、句子的解釋或回答,下面再緊跟書籍名稱和作者。
「就像是在跟書聊天,通過提供的答案來決定是否有興趣繼續閱讀這些書。」負責該項目的 Google 未來學家兼工程主管 Ray Kurzweil 和產品經理 Rachel Bernstein 在博客中說。
據官方介紹,在用戶輸入問題或陳述時,機器學習模型會查看超過 10 萬本書中的每個句子,來查找與這些問題或陳述最接近的答案,並會用粗體顯示,附帶一些上下文。
Google 曾針對這一技術發布過一篇名為 Efficient Natural Language Response for Smart Reply的論文,他們表示,這一成果是把語言的概念編碼成嵌入向量的模型,然後再經過自然語言處理技術進行匹配,這比之前直接把句子拆成單詞來匹配結果要準確得多。Google 已經在 TensorFlow 平臺上提供了訓練模型供開發者進行實驗。
體驗網站中的兩個遊戲 Blocks 和 Arcade 有點像單詞版的消消樂。玩 Arcade 時,需要在規定時間內輸入與藍色目標詞語義相近的單詞、短語或者句子,相關性越強得分越高,如果輸入了不相關的答案,目標詞則會下移產生累積,累積到達頂部,遊戲結束。
Blocks 沒有時間限制,輸入單詞、短語或者句子後,會自動判斷頁面上的哪些單詞與之最相關,然後這些詞與相鄰同色空白方塊就會被消除。每一次消除後都會有新的方塊掉落,方塊堆積到達頂部,遊戲結束。
據 Google,這個書籍搜尋引擎中的技術已經被用來改進 Gmail 的智能回復,他們還在探索可以適用該技術的其他應用,但並未說會在什麼時候正式上線取代現有的圖書搜索功能。
題圖:chuttersnap on Unsplash