Google新PR:以連結距離為基礎的頁面級別

2020-12-04 SEO每天一貼Zac

Google PR是Google誕生以來最具知名度的概念,以至於很多人認為Google PR的意義更多在於公關炒作,而不是排名算法。2016年4月,Google取消了工具條輸出PR值的顯示,站長們再也看不到最新的PR值了,也有很多SEO認為Google完全取消了PageRank算法。現在的Google排名算法中還有PageRank嗎?眾說紛紜。

Google從2006年就不再使用PageRank了

前天,一位自稱的前 Google軟體工程師在Hacker News的一個討論Google替代品的帖子中透露,Google早在2006年就不再使用Google PR了:

The comments here that PageRank is Google’s secret sauce also aren’t really true – Google hasn’t used PageRank since 2006. The ones about the search & clickthrough data being important are closer…

翻譯過來的意思是:

評論裡說PageRank是Google秘方的說法並不正確 — 從2006年Google就不再用 PageRank了。關於搜索和點擊率數據很重要的說法還比較靠譜……

說得很明確,Google算法早就不再使用PageRank了。

這是真的嗎?

為了驗證這位前Google員工身份,SEO們已經做了人肉分析,結論是大概率是真的。這位員工名字是Jonathan Tang,Twitter帳號在此,2009年至2014年在Google工作,他的Hacker News帳號是2007年註冊的,不大可能用這麼老的帳號來胡扯或造謠。

而且,這些年Google與SEO行業的官方溝通人JohnMu在Twitter上評論此事時並沒有否認,只是說:

SEO們應該知道,20年來Google工程師不可能沒有對搜索做出修改。

所以,雖然沒有官方認證,但應該是真的。其實,Matt Cutts等人很早以前也表示過,Google算法肯定還是考慮連結的,而且連結依然是最重要的排名因素,PageRank以及Google排名的基本原理沒有變化,但不可能這麼多年原樣不動地用PageRank的原始版本,肯定是修改過的了。

JohnMu去年也直接評論過PageRank的使用情況,表示現在的Google算法不可能還是一比一地原樣用PageRank的最初公式。

那麼2006年以後工具條顯示的PR是什麼鬼?

前面提到,Google是從2016年取消工具條顯示PR的,如果2006年就不再用PR了,那麼2006年到2016年工具條上顯示的PageRank是什麼東西?

而且Google的另一位發言人Gary Illyes在2017年還發推明確說:「你們不知道嗎,Google在18年後依然在排名算法中使用PageRank(還有幾百個其它信號)。」

所以到底是在用還是不用了?

Jonathan Tang後續又解釋了一下:

他們2006年用另一個算法取代了PR,那個算法給出的結果大致和PR相似,但計算速度快得多。工具條顯示的宣稱是PR的數值就是這個替代算法的結果。這個替代算法的名字都和PageRank相似,所以Google這麼宣稱,在技術上也不能說是錯的。

所以,從2006年開始,Google算法中使用的、工具條所顯示的,都不是原始PageRank計算公式的結果,而是一個結果類似、名稱類似、計算速度快得多的算法。

我們姑且稱之為Google新PageRank吧。

那麼這個Google新PR的計算原理是什麼?Jonathan Tang沒說,連真實名稱也沒說,大家只能猜測了。

疑似Google新PageRank專利

Jonathan Tang的帖子後面,專門研究Google專利的大神Bill Slawski發了個回覆:

Google的新版本PageRank專利2006年通過。巧合?

Bill Slawski去年發帖詳細介紹過這個新版本PageRank專利,這兩天又仔細讀了一下專利原文和Bill Slawski的帖子,這裡介紹一下大意。

專利名稱是Producing a ranking for pages using distances in a web-link graph – 基於連結距離的頁面級別計算。

Google新PageRankshi yi tu

簡單說,新PageRank不再計算導入連結的總數,而是計算這個頁面與種子頁面之間的距離,距離越近,頁面質量越高,頁面級別、新PageRank越高。這個思路和Yahoo!的TrustRank是極為相近的,基本假設都是:好網站不會連結向壞網站,但會連結向其它好網站。

種子頁面、連結長度、連結距離

這個專利涉及幾個概念。種子頁面(Seed Pages)、連結長度(Link Length)、連結距離(Link Distance)。

種子頁面(Seed Pages)

如上面的簡單網絡連結圖所示,Google選出一部分頁面作為種子頁面,如圖中上半部分的頁面106、108、110,下半部分的都是種子頁面集之外的、需要計算新PR值的。

關於種子頁面的幾個要點:

種子頁面顯然是高質量的頁面,專利裡舉的例子是Google目錄(其實就是已經死了的開放目錄)和紐約時報。種子頁面需要與其它非種子頁面有很好的連通性,有比較多的導出連結指向其它高質量頁面。種子頁面需要穩定可靠,有多樣性,大範圍覆蓋各類主題。連結長度(Link Length)

種子和非種子之間有的離得近,有的離得遠。如種子頁面106通過連結132直接連向非種子頁面112,非種子頁面118則沒有種子頁面直接連向它,要通過兩層連結。

連結距離並不是簡單地數連結層數。每個連結Google會計算一個連結長度,連結長度取決於連結本身的特徵和連結所在頁面的特徵,比如頁面上有多少連結,連結的位置,連結文字所用字體等等。

所以,同樣是一個連結,連結長度是不一樣的:

頁面導出連結越多,連結長度越長。這和原始PageRank思路是一樣的,導出連結越多,每個連結分到的權重越少。連結所在位置越重要,比如正文中,正文靠前部分,連結長度越短。連結錨文字字號越大,或者在H1中,可能連結長度越短。我記得Matt Cutts很久以前在談到PageRank可能的修正時提到過,正文中的連結和頁腳的連結被用戶點擊到的概率顯然差距很大,所以不同位置的連結獲得的PR和權重應該是不一樣的。這種說法很符合這個專利的意思。

連結距離(Link Distance)

連結距離就是頁面與種子頁面集合之間的最短連結長度之和。種子頁面和非種子頁面之間通常不止一條連結通路,如示意圖中,頁面118可以通過連結132、136從種子頁面106到達,也可以通過連結134、142、140到達,還可以通過連結134、140到達,還可以通過其它連結從其它種子頁面到達,所有這些從種子集到頁面的連結通路中,連結長度之和最短的那個被定義為連結距離。

如果一個頁面無法從任何種子頁面出發訪問到,也就是種子頁面集合到這個頁面完全沒有連結通路,那麼連結距離是無限大。

然後Google算法根據連結距離計算出一個頁面的排名能力分數,也就是新PR值,最後的排名算法中,這個新PR值作為排名因素之一。也就是說,連結距離越短,離種子越近,Google認為頁面越重要,排名能力越高。

連結距離的計算不需要迭代,所以比原版PageRank的計算要快得多,而在代表頁面重要性上,我相信Google做過對比,準確性差不多,所以就用來代替原來的PR了。

簡化連結網絡圖(Reduced Link-Graph)

專利最後面提到了另一個概念:簡化連結網絡圖(Reduced Link-Graph),不過沒有再說明這個概念有什麼用,用一個段落說了簡化連結網絡圖這個概念後專利就結束了。不過簡化連結網絡圖有可能和連結質量判斷、Penguin算法更新等相關。

在前面示意圖中,所有頁面之間的所有連結組成一個完整的連結網絡圖,其中只由最短連結距離通路組成的連結被稱為簡化連結網絡圖,也就是用來計算新PR值的那些連結。顯然,簡化連結網絡圖是完整連結網絡的一個子集,不過每個頁面的連結距離都已經保留在簡化連結網絡圖中了,去掉的那些連結對頁面連結距離和新PR值沒有影響。在簡化連結網絡圖中,每個頁面獲得的連結權重來源都是可以回溯到最近的種子頁面的。

如果一個頁面從種子集合完全沒有連結通路可以到達,也就是前面說的連結距離為無限大,這個頁面將被排除在簡化連結網絡圖之外。如果一個頁面得到的連結都來自簡化連結網絡之外,雖然連結總數可能很大,但其連結距離依然是無限大。

換句話說,在簡化連結網絡之外的連結是被忽略掉的,無論有多少連結。聯想到Penguin 4.0算法更新,其中一個特徵就是,垃圾連結是被忽略掉的,不被計入連結的流動中,這和基於連結距離的頁面級別非常相似。

相關焦點

  • 關於Google PR 值清零的一些看法
    至於這樣說是有原因的,因為谷歌為了悼念史蒂夫·賈伯斯(Steve Jobs)逝世,在其搜索框下面顯示了 Steve Jobs, 1955 – 2011,並且 Steve Jobs 的連結是指上蘋果官方網站上面的。2、Google 「熊貓算法」的更新估計做 SEO 的一些優化人員應該聽說過谷歌今年新推出的「熊貓算法」。
  • Google全站連結是什麼?如何為網站獲取Google全站連結?
    有時,當你在Google中搜索某個公司名稱時,你可能會注意到某個搜索結果佔據的空間比其他結果多,因為該搜索結果包含指向網站其他重要頁面的站點連結。Google中的這些全站連結可幫助你的品牌脫穎而出並獲得更多的曝光率。本文將分享如何為網站獲取Google全站連結。什麼是Google全站連結?
  • 關於PHP在linux下面獲取GOOGLE的PR值
    define('GOOGLE_MAGIC', 0xE6359A60); class pageRank{var $pr; function zeroFill($a, $b){   $z = hexdec(80000000);  if ($z & $a){    $a
  • 站長必知: Google的頁面等級(PR值)
    這些都是基於Google的複雜文本匹配運算法則及其搜索程序所使用的Pagerank系統(網頁級別技術)。 Google之所以受網站管理員和Internet媒體服務的歡迎,是由於它並非只使用關鍵詞或代理搜索技術,而是將自身建立在高級的網頁級別技術基礎之上。別的搜尋引擎提供給搜索者的是多種渠道得來的一個粗略的搜索結果,而Google提供給它的搜索者的則是它自己產生的高度精確的搜索結果。
  • 分享穩定提升PR值的方法
    分享穩定提升PR值的方法 PR值,就是網頁等級的意思,是Google衡量一個頁面的標準。本文介紹的是穩定提升網站PR值的方法,希望對大家有幫助,一起來看。
  • 16款Chrome擴展插件以及擴展頁面無法訪問解決辦法
    安裝方法也很簡單,打開PDF Download官方頁面,然後將 「Save Page as PDF」拖到瀏覽器的標籤欄,當需要將某一網頁轉換為PDF文檔時,點擊「Save Page as PDF」,稍等片刻即可免費獲得高質量的PDF文檔了。
  • Google PR值更新總結
    根據(你們也可以以此來對你的網站進行推測一下):在我的多個網站中,還有多個二級頁面PR為0。而這些PR為0的頁面絕大多數都是在二月中旬後才上傳或者建立的;這對證明PR更新前收集數據的截止時間一流定的幫助。既然,PR更新前收集數據的截止時間已經大概知道。
  • SEO是怎麼改進內部連結的:計算站內PR值
    現代搜尋引擎使用連結來抓取網頁。這些搜尋引擎使用的爬蟲單擊頁面上顯示的每個連結(內部連結和外部連結),然後單擊每個後續頁面上的所有連結,依此類推。這使搜尋引擎可以找到您的頁面並在其索引中對其進行排名。Google之類的搜尋引擎還使用連結數對查詢結果進行排名,並將頁面的所有指向連結視為對該頁面的重要性投票(即PageRank)。
  • AE和PR動態連結的秘訣
    值得慶幸的是,那些黑暗的日子已經過去了,這種保持健全(並節省時間)的動態連結功能可以在After Effects和Premiere項目之間創建連結。簡而言之,如果您在After Effects中更改標題,它將自動更新Premiere中的元素。在項目之間創建動態連結後,選定的After Effects合成將在剪輯中顯示為Premiere瀏覽器。藉助這個便捷的小捷徑,一切都簡單了起來。
  • 查詢網站收錄和反向連結有哪些方法
    還有的朋友因為是用工具來查詢,但是不同的站長工具統計出來的結果會有點偏差的,而新站能收錄幾個頁面也不容易,所以對結果一般都比較介意。一般老站長都是用統計工具大概了解一下就行了。那麼今天牛起來帶大家了解一下比較準確的統計方法。
  • pr值得作用是什麼以及如何提升?
    什麼是pr值pr值就是網頁的級別,網頁的價值。pr值的主要的發布者是谷歌,那麼它的等級從什麼級開始呢?從零級開始,1、2、3、4、5、6、7、8、9、10。怎麼查看一個網站的pr值呢?我把需要查詢的網頁複製到站長工具,點擊pr值那一欄即可查詢。網站pr達到3、4、5已經有一定的價值了,這是一個簡單的標準。
  • GOOGLE讓你成為黑客
    google hacking其實並算不上什麼新東西,當時並沒有重視這種技術,認為webshell什麼的,並無太大實際用途.google hacking其實並非如此簡單... google hacking的簡單實現 使用google中的一些語法可以提供給我們更多的信息(當然也提供給那些習慣攻擊的人更多他們所想要的.),下面就來介紹一些常用的語法.
  • 安卓版Chrome 77正式發布:新的下載頁面
    其中,Chrome77 下載頁面有所調整,「發送此頁面」共享功能也更為廣泛了。據9to5google報導,Chrome已經允許用戶檢查在使用谷歌帳戶登錄的設備上打開了哪些標籤。Chrome77 版本增加了一個更直接的「發送此頁面」功能。雖然使用Chrome自定義標籤時可能會出現帶有Chrome圖標的「發送到您的設備」目標,但發送僅在瀏覽器中有效。
  • Google為實時搜索開闢專有網站入口
    早在去年12月,Google就開始提供實時搜索連結。不過用戶必須點擊左側的「最新」和「更新」才能看到。如果「最近更新」的標籤出現在搜索結果中,點擊後也能打開一個只有實時搜索信息的頁面。 訪問:Google Realtime現在,Google搜尋引擎正式將它取名為Google Realtime,它也有了自己的獨立網址:http://www.google.com/realtime,用戶如果想查看此類搜索信息
  • 研究表明,與將品牌推廣活動連結到商品頁面相比,將其連結到亞馬遜...
    Part1 以下是我們的上新心得 上新第一步:做好零售準備 上新第二步:制定商品推廣策略 ● 創建商品推廣活動,通過商品推廣活動,當消費者進行搜索時,就能在結果頁面中直接看到和購買我們的商品。
  • 如何查看網站關鍵詞排名在Google的第幾位
    Google三件套 我們使用第一套檢測網站關鍵詞排名的工具當然是Google自帶的工具啦,畢竟所有的排名基礎都在Google上的 Google keyword planner 網址 ads.google.com GKP是Google
  • Google 更新了PR查詢接口伺服器
    無意間發現,在GET數據時,google 返回了302 重定向可以看出,Google 這次是將 toolbarqueries.google.com 的請求,重定向了 toolbarqueries.google.com.hk這與 Google移居香港 的聲明不謀而合,但 Google 為何使用
  • 很準的google PR值在線預測工具推薦
    首頁 > 空間 > 關鍵詞 > SEO最新資訊 > 正文 很準的google PR值在線預測工具推薦
  • 垃圾網站1年內pr值從0到6的秘密
    很多人感到疑惑的是為什麼有些垃圾站明明只有幾十篇文章,且全部是廣告,根本沒有實際內容,卻可以PR值為4或者5,甚至6?其實,這些完全是一些人為炒作出來的。這裡給大家揭秘一個企業垃圾網站1年內pr值從0到6的秘密。目前很多公司認識到網絡的重要性,紛紛建立了自己的公司網站,網站內容以介紹企業產品為主。