AI算法入駐Google搜尋引擎,詞條再冷也可手到擒來!

2020-12-13 鎂客網

近期,Google搜尋引擎引入一種新的算法,在此基礎上,哪怕搜索詞條再冷門,用戶也可以搜到自己滿意的信息。

網際網路的能力是強大的,它幾乎囊括了一切我們日常生活中想要獲得的信息,但有時候因搜索詞條過於冷門而找不到信息時,大多數人也只能雙手攤開,表達自己的無奈。在這個bug的前提下,搜尋引擎人工智慧化成為目前不可阻擋的趨勢。

日前,搜尋引擎巨頭Google在自家搜尋引擎中引入一種名為RankBrain的基於人工智慧技術開發的算法,以優化搜尋引擎的網頁排名。具體是怎麼操作的呢?

網頁排名操作步驟

一般來講,搜尋引擎的網頁排名基本分為4個步驟:

爬行抓取:搜尋引擎蜘蛛(一個能夠在網上發現新網頁並抓文件的程序)從已知的資料庫出發,像正常用戶的瀏覽器一樣訪問網頁並抓取文件。另外,蜘蛛還會爬行跟蹤網頁中的連結以訪問更多的網頁,再重複以上抓取過程。

索引:這些頁面文件被蜘蛛抓取後,將會被進行分解、分析,並以巨大表格的形式存入資料庫。其中,網頁文字內容,關鍵詞出現的位置、字體、顏色、加粗、斜體等相關信息都有相應記錄。

搜索詞處理:用戶在搜索框內輸入關鍵詞並單擊「搜索」按鈕後,搜尋引擎程序即對搜索詞進行處理,如中文特有的分詞處理,判斷是否需要啟動整合搜索、是否有錯別字等情況。

排序:在上述三個步驟完成後,根據搜索詞,搜尋引擎將會從索引資料庫中找出所有包含搜索詞的網頁,然後根據排名算法計算出哪些網頁應該排在前面,最後按照一定格式返回到"搜索"頁面。

網頁排名影響因素

在網頁排名關鍵中,網頁的排名先後受到諸多因素的影響,就拿Google的排名公式來看:Google分數=(相關關鍵詞分數X0.3)+(域名權重X0.25)+(外鏈分數X0.25)+(用戶數據X0.1)+(內容質量分數X0.1)+(人工加分)–(自動或人工降分)

從公式中我們可以看出,針對搜尋引擎網頁排名,最為直觀的影響因素就有6個,分別是關鍵詞、域名權重、外鏈分數、用戶數據、內容質量以及人工幹預,而在這6大因素下面,又有著各自其他的小因素,例如在用戶數據這一塊上,搜尋引擎就要考慮到搜尋引擎結果頁面(SERPs)的點擊率、用戶在網頁上呆的時間、域名或URL搜索量、訪問量及其他Google可以監測到的數據(工具條、GA之類)等4個小因素,至於這4個因素下面還有多少其他的小小因素,這就不得而知了。

RankBrian的工作原理

搜尋引擎網頁排名的的基本工作原理已大概知曉,雖然搜尋引擎的資料庫很強大,但仍然會有一絲瑕疵的存在,比如冷門關鍵詞的相關搜索。由於關鍵詞的邏輯排列以及固定詞彙等因素,搜尋引擎給出的信息難免會有局限性,從而不能正確或全面得對關鍵詞進行理解,以給出用戶所需要的信息。

Google在搜尋引擎中引入的RankBrain算法,其目的就在於優化搜尋引擎的網頁排名。目前,在 Google 用來決定網頁排名的數百個因素中,RankBrain的重要性已經位居第三。

而在冷門詞條搜索方面,RankBrain算法也確實有效的給出了一個解決方案。通過RankBrian,Google可以對這部分冷門詞條進行分析和重新匹配,從而使得搜索結果更加準確。舉個例子:在 Google 中輸入「best flower shop in Los Angeles」一類冷門的搜索,RankBrian會通過語義分析和詞庫聯想,識別出搜索關鍵詞的重點意義。比如這句話,RankBrian就會判別出其與搜索頻率更高的「best LA flower shops」比較像,然後給出後者的搜索結果。

從RankBrian的工作原理可以看出,其最為關鍵的人工智慧技術就是「語義理解」,只要將這部分做好,那麼在將來,哪怕是再冷門、再繁瑣的搜索詞條,Google都能給予用戶最準確的信息反饋。

據悉,早在2015年年初,Google就逐漸推出了RankBrain,但也僅限於一部分搜索結果。目前,Google已將該算法應用於每天每一次的搜索中,每天提供的搜索服務多達55多億次。

最後,記得關注微信公眾號:鎂客網(im2maker),更多乾貨在等你!

相關焦點

  • Google調整搜尋引擎算法:HTTPS網站排名更高
    2014-08-08 09:01 Google 在自己的官方博客發布公告,已經調整其搜尋引擎算法,採用 HTTPS 加密的網站在搜索結果中的排名將會更高。Google 稱在過去數月已經對目標網站是否採用安全層進行過測試。
  • seo搜尋引擎工作原理簡介是怎麼樣的
    seo搜尋引擎工作原理簡介是怎麼樣的麵包屑導航:google結果列表中經常出現麵包屑導航格式,原本顯示URL的地方,改成麵包屑導航。從現在這種格式以來,麵包屑的每一級名稱都是指向對應分類頁面的連結,用戶可以點擊訪問分類頁面。
  • 其實,ai不止是一項科技,更是一種文化,一種觀念
    其實,ai不止是一項科技,更是一種文化,一種觀念。自2016年alphago在圍棋系列賽中戰勝職業棋手以來,ai已經開始在某些領域中取得進展,並且在某些問題上實現了突破。在最近的新聞中,谷歌發布的兩張miranda照片不僅僅是事實,還再次為我們揭開了ai正在開始各領域進行科學研究的新面貌。
  • 關於Google PR 值清零的一些看法
    估計很多站長第一感覺是自己的站是不是被 Google 清除了PR值,當站長們再查詢其它站點,才發現其它站也沒有了 Google PR 值,大家這才發現是谷歌的問題。哪麼今天是什麼原因導致 Google PR 清零呢?估計外面說法也有很多,那麼我也說說我的幾種看法吧!
  • 20節SEO入門課程(十一、十二):搜尋引擎排名原理和算法
    我們這節課講的是搜尋引擎的排名處理原理。如果你對於搜尋引擎內核的東西一無所知,只是學習怎麼去發文章,怎麼去發外鏈,你永遠都沒有辦法成為一個獨立的站長,你只是跟著操作,跟風。不明白搜尋引擎背後的排名處理的過程,你的靈活性會將大大的降低的。所以,我特意安排的這麼一節課,這裡講的就是搜尋引擎他是怎麼樣來進行處理這個頁面的排名的。
  • SEO必知:Google算法十年變遷史-Google,搜索,算法,SEO ——快科技...
    Google算法每年的改變都多達500-600次,只不過很多改動都很小,但是每隔幾個月,Google都會做一次比較大的算法升級,這些升級都會直接影響到搜索的排名結果。作為一個搜尋引擎營銷人員,了解這些算法的改變有助於分析網站排名以及流量的變化狀況,下面我們列出了幾次影響比較大的算法升級,熟悉這些算法的變動將會有助於你的SEO工作。
  • 如何判定網站是否遭受 企鵝算法懲罰?
    相比之下,外鏈建設是谷歌搜尋引擎排名機制重點關注的對象,而且也是各種不合規行為的重災區,很多人有意或者無意識的都可能觸碰到企鵝算法的高壓線,所以我覺得很有必要去著重講一下企鵝算法的懲罰機制與具體表現判定。在隨後的文章中,Jack老師還將寫一篇關於如何預防和正確處理外鏈建設過程中可能被企鵝算法懲罰的文章。
  • Google Cloud 發布 COVID-19 數據集,可構建 AI 模型來對抗疫情
    另外,Google 還推出了專門的頁面和搜索門戶來整理有關 COVID-19 的資源,這家科技巨頭的母公司 Alphabet 也加大了灣區疾病篩查計劃的力度,本文參考連結: https://cloud.google.com/blog/products/data-analytics/free-public-datasets-for-covid19
  • 谷歌AutoML新進展,進化算法加持,僅用數學運算自動找出ML算法
    論文連結:https://arxiv.org/pdf/2003.03384.pdfGitHub 項目地址:https://github.com/google-research/google-research/tree/master/automl_zero#automl-zero在這項研究中,谷歌提出了新方法 AutoML-Zero
  • 國內外學術論文網站與常用的學術搜尋引擎推薦
    在此為大家分享國內外學術論文網站與常用的學術搜尋引擎,希望對各位奮戰在學術科研道路上的你有幫助哦!18.Espacenethttp://ep.espacenet.com/電子圖書,2002前提供10000種全文電子圖書歐洲專利局,也可查世界專利
  • 騰訊工程師提議用中文索引算法創建DNA搜尋引擎
    多數研究人員使用的是BLAST或FASTA算法,它們本質上逐一比較每個基因組。現在中國第三大搜尋引擎、騰訊旗下搜搜(SOSO.com)的一位計算機科學家王亮(Wang Liang)提出應用中文索引算法去檢索生物信息。
  • 谷歌發布3年來最大的一次搜尋引擎算法改進
    谷歌於星期四迎來了自己的15歲生日.為了慶祝,谷歌也於當天宣布了號稱是自2010年以來最大的搜尋引擎算法改進.谷歌表示本次算法改進是基於頁面排名與指數的重新思考
  • ​Google SEO搜尋引擎優化入門指南,用小細節建成的高樓大廈...
    最簡單的解釋可以這麼說: 1)用過一系列的優化方法,讓搜尋引擎「看懂」你網站的內容 2)搜尋引擎看懂後,會根據算法決定是否把你的網站排在自然搜索結果頁面的最上方 3)網站的排名越靠前就能夠獲得越多的自然流量 看了上邊的步驟解釋,你大概也明白SEO是怎麼一回事了!
  • 第二屆AETA地震預測AI算法大賽啟動啦!
    打開APP 第二屆AETA地震預測AI算法大賽啟動啦! 天這麼冷除了抖腿還能做啥子嘛?     「寒夜客來茶當酒」 & 「對酒當歌」 or「錦罽暖親貓」 or「燈前小草寫桃符」 又或者去試試 「獨釣寒江雪」?
  • CHPO網站和搜尋引擎引入OMIM和ORPHANET疾病中文譯名並徵求意見
    CHPOwiki網站和搜尋引擎已引入OMIM遺傳病原始中文名錄(5271個詞條)和ORPHANET罕見病原始中文名錄(4348個詞條)(維護人:
  • 世界名校、大廠人才匯聚,「馬欄山杯」算法大賽打造AI視頻競技場
    圖靈獎得主姚期智帶領下的清華「姚班」每年都會走出一批計算機領域的英才,如曠視創始人唐文斌、印奇、楊沐,pony.ai的創始人樓天城等。而南京大學、北京大學、浙江大學、復旦大學、上海交通大學等國內高校在人工智慧領域也頗具國際影響力,位列CS Ranking「人工智慧」分榜前20名。
  • 最全的國內外學術論文網站與常用的學術搜尋引擎
    18.Espacenethttp://ep.espacenet.com/電子圖書,2002前提供10000種全文電子圖書歐洲專利局,也可查世界專利1、http://scholar.google.com/雖然還是Beta版,但個人已覺得現在已經是很好很強大了
  • 除了Google,國外的搜尋引擎你還認識幾個!
    > 現在國內想要用 Google 需要翻牆才行,對於沒法翻牆的小夥伴們,其實也可以通過其他搜尋引擎搜索客戶哦。今天給大家推薦一些常用的國外搜尋引擎,外貿小夥伴們自取不用謝!Bing (bing.com)Bing 中文品牌名為「必應」。