SEO的索引和抓取是什麼意思,外貿自建站如何優化索引和抓取?

2020-12-10 雨果網

谷歌跨地域跨平臺的強大覆蓋,助您贏得全球消費者的每時每刻!

2017-12-27 15:08

SEO優化往大了講海納百川,往小點講也有很多重要元素。抓取和索引這兩件事就是SEO領域中簡單而又重要的觀念,熟悉了解它們之後便可以優化搜尋引擎蜘蛛抓取、索引你的網站。

了解網絡蜘蛛

Google官方將它稱為Google Spider、Google Bot,我們便將其稱之為蜘蛛,想像一下網際網路便是一個又一個的蜘蛛網連在一起,而搜尋引擎本身有屬於它的軟體,就像是蜘蛛一樣在巨大的網絡上爬行,並收集 資訊。

做 SEO工作,維持網路蜘蛛與網站之間良好的關係是非常重要的,你必須要了解各大搜尋引擎蜘蛛的效能以及規範,並儘量讓它能夠完整抓取你網站上的優質內容。

早些年,Bing的蜘蛛太大容量的網站內容會無法抓取,這是它本身的功能限制,你必須要把最好的內容往前方,如果容量太大的話,後邊的內容Bing是抓不到的。

理解抓取 ( Crawl ) 、索引 ( Index )

搜尋引擎運作原理我們可以簡單說為:

抓取 ( Crawl) – > 演算、建立索引到搜尋引擎上 ( Index ) – > 供查詢、使用

抓取 ( Crawl) 便是指搜尋引擎捕捉你網站上的資料的行為,包括網站的關鍵字、內容、反向連結等等,刷取完畢之後便會通過索引蜘蛛在爬完你的資料之後,將所有內容進行演算、歸檔,並且收錄到搜尋引擎中,這個建檔、收錄的過程被稱之為( Index )。

索引完成之後,用戶才能在搜尋引擎中找到你的網站,簡單來講,先有抓取才會有索引,通過Google站長工具,我們可以看到網站被抓取、索引的情況。

抓取和索引是完全不同的兩件事,有可能你的頁面被Google正常抓取,卻沒有將頁面索引到搜尋引擎上,這樣的情況一般來講就很有可能是你的網站有違規的行為,又或者排名太差,在搜尋引擎上根本找不到自己的頁面。

抓取 ( Crawl ) 與索引 ( Index )的優化工作

為什麼抓取 ( Crawl ) 需要優化?

抓取的優化功能就是要確定Google、Bing在抓取、並且是完整的抓取整站的資料,有可能因為某處的網站結構以及HTML語法的錯誤,導致它看不到你的網站,這是非常致命的一件事情。

當然,有時候你也不希望蜘蛛去抓取某些個網站,比如說有頁面未完成、還在測試階段,你不希望Google看到這個頁面,那就必須使用些特殊的語法,阻止蜘蛛抓到這些頁面的資料。

為什麼索引 ( Index )需要優化?

測試索引 ( Index )的唯一辦法就是實際使用搜尋引擎去搜尋自己的網站。

先排除排名的情況外,先確保你的頁面都有正常的建立搜尋引擎,並且某些頁面會影響用戶體驗,你並不希望被建立進搜尋引擎,你就要使用meta robots來進行SEO工作。

怎麼阻止搜尋引擎抓取 ( Crawl ) 和索引 ( Index )頁面

meta robots以及robots.txt的工作分別是阻止Google 抓取、索引你的頁面,可是我們明明巴不得搜尋引擎把整站的頁面全都給抓取、索引,為什麼還要阻止搜尋引擎呢?

這年頭已經不是單純SEO排名、流量高就有用的,為了能夠讓網站產生價值,製造轉換,所以使用體驗相對重要,如果你有些頁面會給用戶帶來不好的體驗,可以用這個辦法去阻止該頁面出現在Google搜索結果中。

Robots.txt可以阻止搜尋引擎抓取你的資料,如果你使用了robots.txt來阻擋搜尋引擎,那麼搜尋引擎將會略過你所阻擋的頁面,不去做抓取。

但meta robots 就不同了,他在索引層面阻止搜尋引擎索引你的頁面,但Google還是有抓取你的網站資料的,但究竟為什麼我們要這樣做?

關於Robots.txt的一些事情

大多數情況下,我們都不會使用Robots.txt來阻止搜尋引擎抓取我們的網站,除非你確定這個頁面對SEO有負面影響,若你有頁面不希望出現在搜尋引擎上的話,還是用Meta Robots控制索引就好,除非有以下的情況:

·未完成的頁面

網站頁面正在開發中,並且開發時間比較長,甚至還需要進行修改、索引,這時候被蜘蛛抓取、索引,可能會給用戶搜索帶來錯誤的信息,而且未完成的頁面也會影響用戶的使用體驗。

·測試頁面

新首頁、新頁面測試之類,這些一模一樣的頁面、域名會讓搜尋引擎犯迷糊的。

·網站後臺、其他原因

注意-Google說它們是參考參考

了解meta robots以及robots.txt之後,你可以優化網站的抓取及索引狀況,阻止特定頁面跟被抓到或是被索引。

Google官方有明確的聲明,meta robots和robots.txt確實可以告訴Google你希望那些頁面不要被抓取以及索引,Google也會儘量尊重你的決定。

然而,Google官方不保證搜尋引擎會完全服從meta robots和robots.txt,肉搜尋引擎認為你的網站有很多很多反向連結、流量很高、內容很優質、是非常非常棒的網站,它也有可能執意要抓取、索引你的網站。

相關焦點

  • 搜尋引擎的工作原理:了解抓取工具所需的一切
    儘管Google和其他搜尋引擎都對搜索結果背後的機制保密,但營銷人員卻從了解搜尋引擎的工作原理中受益。了解搜尋引擎如何查找,組織和選擇結果意味著您可以更好地優化網頁排名。一、搜尋引擎的工作原理:基礎知識「搜尋引擎」是幾種相互關聯的機制,這些機制可以根據您在搜索欄中輸入的文字一起識別網頁內容(圖像,視頻,網站頁面等)。
  • Google索引指南告訴你:如何更快地讓谷歌搜索收錄你的外貿網站
    所以為了能讓自己的外貿網站能夠出現在搜索展示結果裡,我們需要把自己網站頁面數據編入Google索引庫,成為它龐大資料庫的一部分,Google在建立索引過程之後,Google的算法開始根據各種因素(例如關鍵字,內容質量和訪客體驗信號,EAT等)對頁面進行排名,這個排名就是搜尋引擎對你網站的排名結果。
  • 【乾貨】Google Webmaster Tools怎麼用來做谷歌SEO?
    ,用於網站和SEO! 谷歌站長可以讓你更快的被谷歌收錄,你可以用它幫助你管理外鏈,檢測在Google優化過程中的成績,可以給你提供很多的信息和報告! 驗證成功後,就可以使用了,前提是你的網站已經提交谷歌收錄了,robots文件允許訪問和抓取,然後過一段時間以後你就會看到站長工具左側谷歌索引裡面你的網站慢慢被收錄的曲線 2.開設郵件提醒功能 導航欄可以設定讓Google給你郵件提醒,站長工具有時候也會給你一些命令和反饋郵件,比如抓取錯誤或者匹配失敗等!
  • 屏蔽蜘蛛抓取的後果
    爬蟲是搜尋引擎用來抓取網站的一套自動化程序,是搜尋引擎基本原理所必須的一環,屏蔽爬蟲抓取之後,搜尋引擎蜘蛛將無法抓取網站。除了有品牌保護的品牌詞會排名第一,其他關鍵詞的排名基本會消失,甚至索引也會被清除。
  • 關鍵詞是什麼意思
    關鍵詞是什麼意思!什麼是關鍵詞,SEO 優化人員在進行優化時候常常會說道優化名詞術語-關鍵詞。那麼什麼是關鍵詞,我們常說的關鍵詞排名是怎麼回事。百度關鍵詞又是什麼,好的今天小貓 SEO 就來告訴大家關於 SEO 中關鍵詞的那些事。
  • 按照搜尋引擎蜘蛛抓取規則定期更新文章,穩定首頁排名不在話下
    因為它將被降級和沙盒,它將給搜尋引擎留下一個壞印象,你的網站排名就會不穩定。作為搜尋引擎評分網站的重要標準,我們需要關注它。那麼什麼是優質內容呢?我們認為創意和網站內容是兩個重要方面。不管你怎麼寫,都要注意發表的內容與網站主題的相關性。加強兩者之間的聯繫有什麼好處?首先,它有利於增強用戶體驗。二是有利於吸引搜尋引擎的青睞,建設優質網站,提高網站權重。
  • 外貿行業seo網站優化引流內容分享
    說起外貿行業這是很從心seo近幾年才開始接觸一個行業,對於很從心seo來說,在谷歌沒退出國內市場的時候,很多項目是百度和谷歌一起做的,而當谷歌退出後,大部分的項目也就隨之放棄了谷歌,但外貿這是一個將我們的產品銷售到海外的行業,那麼對於這些小夥伴們來說,谷歌就是大家要重視其他的平臺了
  • seo搜尋引擎工作原理簡介是怎麼樣的
    seo搜尋引擎工作原理簡介是怎麼樣的麵包屑導航:google結果列表中經常出現麵包屑導航格式,原本顯示URL的地方,改成麵包屑導航。從現在這種格式以來,麵包屑的每一級名稱都是指向對應分類頁面的連結,用戶可以點擊訪問分類頁面。
  • 網站地圖到底對seo有什麼作用?能起到什麼效果
    網站地圖到底對seo有什麼作用?能起到什麼效果說白了網站地圖,即Sitemap可便捷系統管理員通告搜尋引擎,她們網站上帶什麼能夠抓取的網頁頁面,搜尋引擎會最先爬行運動網站的robots文檔,在這一文檔裡,實際上還包括了此外一個十分關鍵的內容,那便是網站地圖sitemap,在其中百度網Sitemap就是指百度網兼容的百度收錄規範,在原來協議書上作出了拓展。
  • 如何理解seo中的聯關係計算、特殊文件處理、網頁的內容質量計算
    如何理解seo中的聯關係計算、特殊文件處理、網頁的內容質量計算等1、連結關係計算;連結關係也是seo中預處理中很重要的一部分。現在所有主流搜尋引擎排名因素中都包含網頁之間的連接流動信息。搜尋引擎在抓取頁面內容後,必須事前計算出:頁面上有哪些連結指向哪些其他頁面。
  • SEO如何診斷Google索引狀況?分析網站架構頁面健康與否
    2017-12-27 16:50 分析網站的索引狀況就如同醫生觀察病人一般,如果有什麼異常,便會最先在索引中體現出來,而Stie指令就是用來檢查
  • title是什麼意思_HTML網頁標籤_SEO標題優化
    title是什麼意思?<body>內容</body></html>二、title形式tltle標籤成對出現在網站源文件內保存網站網頁出現的文件名就是網站title標籤內的文字顯示在瀏覽器的標題欄搜尋引擎抓取頁面
  • 搜尋引擎原理介紹-seo網站運營技術
    搜尋引擎抓取的原理和步驟主要分為四點:即抓取、過濾、建立索引、輸出結果。1、抓取蜘蛛在對網站進行抓取時會採取兩種抓取策略:廣度優先策略和深度優先策略。廣度優先是蜘蛛會先抓取起始網頁中的所有連結後,再選擇其中一個連結抓取此網頁中的所有連結;深度優先就是蜘蛛會從起始頁開始,一個連結一個連結跟蹤下去,處理完這條線路後再轉入下一個起始頁。而搜尋引擎會混合使用這兩種策略對你的網站進行抓取。蜘蛛抓取的內容包括連結、文本、圖片、視頻、CSS、JS、iframe框架。
  • 常見客戶SEO問題解答:搜尋引擎的優化規則是什麼
    1、搜尋引擎的具體優化規則是什麼? 搜尋引擎的優化規則是什麼 此類問題實際上很寬泛,相當於問「SEO怎麼做?」
  • 外貿seo是啥?外貿SEO如何選擇關鍵詞?
    seo是英文單詞Search Engine Optimization首字母的縮寫,翻譯成中文就是「搜尋引擎優化」,是一種通過觀察搜尋引擎規律來提高自己的網頁在搜尋引擎中排名方法。首字母的縮寫,翻譯成中文就是「搜尋引擎優化」,是一種通過觀察搜尋引擎規律來提高自己的網頁在搜尋引擎中排名方法。
  • 關於提升Google排名的15個基本優化項目,強化外貿自建站整體質量
    外貿網站的排名在Google中的高低除了內容質量以外,那就是網站本身的質量,是否使用正確的優化方式,排名也會隨之提高或降低,本篇為大家整理15個基本的SEO站內優化項目,一起來檢查並優化你的網站吧!
  • SEO優化上首頁之搜尋引擎原理用戶需求理解
    經過前面《搜尋引擎原理SEO優化上首頁之網絡蜘蛛Spider》和《搜尋引擎原理SEO優化上首頁之內容處理與創建索引》介紹,搜尋引擎已經完成頁面抓取和分析,並把原始頁面、索引等信息存儲在搜尋引擎伺服器的資料庫裡,等待響應用戶查詢。
  • 弄清原理更好優化
    很多seo工作人員都不清楚搜尋引擎的工作原理,其實搞懂原理更好優化,那麼今天小編就來講講搜尋引擎工作過程的三個階段:1,爬行和抓取搜尋引擎對網站進行爬取,收集網站的頁面數據,存入自己的資料庫;>2,預處理索引程序對抓取的頁面繼續預處理,包括文字提取,分詞等處理;3,排名用戶採用某個關鍵詞搜索,排名程序調用資料庫數據,進行排序,生成搜索頁面。
  • 外貿網站的News怎麼寫可促進谷歌SEO排名?
    說到谷歌SEO,外貿網站中的News則在SEO中起到了舉重輕重的作用。事實上,不少谷歌排名較好的網站就是通過高質量的文章實現的。 那麼今天我們一起來看看,外貿網站的News如何寫可以促進谷歌SEO排名呢?