從擁躉到逃離:搜尋引擎技術人員眼中的百度「窘態」

2021-01-13 網易科技

1月23日,百度APP向21世紀經濟報導記者推送了一條達沃斯相關的企業新聞,作者為不知名的百家號小號,隨後相關企業向記者證實其為假消息。



文/楊清清 

【編者按:百度「窘態」】

百度又一次引起爭議,這一次是因為百度搜索的結果,多數都是自家產品的內容。21世紀經濟報導記者在採訪諸多內容原創作者時,對於百度搜索和百家號都有質疑,其中就包括不保護原創等。記者也發現,百家號上甚至出現假新聞。不僅僅是普通用戶,不少專業從事搜索技術工作的人也開始從擁躉轉向逃離百度。有分析人士認為,在網際網路激烈競爭中,巨頭並不相互開放,百度將自家產品權重提高是無奈之舉。然而這樣的觀點難以站住腳,除了幾家巨頭,門戶網站、權威媒體網站等都是開放的,百度搜索並不缺乏優質內容。百度之所以這樣操作,更多是其在競爭中整個生態系統處於下風,而百家號也成為其廣告收入的重要來源。正是競爭力的減弱,百度也遭遇了國際投行對其業績的擔憂,從而下調其股價。(張星)

1月22日晚間,一篇名為「百度搜尋引擎已死」的文章在朋友圈流傳,該文明確指出,近半年來百度搜索首頁的結果,半數以上會指向百度自家產品:百家號、百度百科、百度貼吧、百度經驗以及「百度系」的愛奇藝等。

甚至,即便是營銷和質量低劣的內容,但就是因為發布在百度相關產品上,也會排在搜索結果的前位。

其中,尤為引發爭議的是百家號的優先結果。「我曾經遇到過,在其他渠道上發出了原創作品後,不一會兒就被不知名百家號帳號全文轉載,標為原創、排在搜索結果首頁,並且申訴無效。」數位原創作者向21世紀經濟報導記者表示,百家號的判定機制事實上並不保護原創,而是保護首發。

之所以如此,是因為百度正在將資源與權重向百家號傾斜,而其結果就是,用戶在搜索結果時,作為搬運工的「不知名小號」往往被排在最前位,而真正的內容原創渠道,甚至權威媒體機構網站的搜索結果,大量從百度搜索首頁上神秘消失。

「百家號初衷很好,但是搜索結果的確沒有處理好與其他網站內容的展示和權重,」一位曾在百度搜索工作的員工向21世紀經濟報導記者坦言,「百度原本可以將百家號權重和內容做得更好,目前結果的確不如人意。」

逃離百度

江琳(化名)曾經做過很長時間的搜尋引擎優化(Search Engine Optimization,SEO),對於百度搜索的規則了如指掌。

她也一度是百度的擁躉,不僅是其忠實用戶,甚至在百度因競價排名屢陷風波時,她也認為一定程度上作為平臺方「技術無罪」,技術反映的只是人性。

然而,從2017年底,她開始選擇逃離百度。「我本人已經不用百度搜索了,因為它的搜索結果不能匹配用戶的需求,而是按照自己的一套規則去走。換句話說,我搜不到我想要的東西,」江琳向21世紀經濟報導記者直言,「這不僅是競價排名的問題,而是算法建模的問題。」

「按照自己的規則運轉」,近半年來尤為體現在百家號產品上。多位原創作者向21世紀經濟報導記者直言,自己的原創內容發布在門戶網站、權威媒體網站上,排名卻不如未經授權轉載自己文章的不知名百家號。

「難道門戶網站、權威媒體網站的權重與權威性,還不如一個不知名小號?」一位原創作者無奈道,「不太理解百度此舉背後的規則標準。」

如果說,百家號內容優質,能夠成為具備公信力,且真正支持原創者的內容產品也無可厚非,然而當前的現狀是,不僅未經原創作者授權的「盜版」內容在百家號上泛濫,甚至百家號上還不乏小號編制的營銷內容、標題黨、假消息。

其中,還存在譯自「洋蔥」新聞的假新聞。1月23日,百度APP向21世紀經濟報導記者推送了一條達沃斯相關的企業新聞,作者為不知名的百家號小號,隨後相關企業向記者證實其為假消息。

「百度作為搜尋引擎,其成長基因與歷程就不是依靠原創來的,這也導致其平臺上的文章即便許多是複製粘貼,但只要發布後就會被抓取,卻沒有評定是否真為原創的規則,」一位不願具名的業內人士向21世紀經濟報導記者表示,「百度總體而言是鼓勵首發,鼓勵內容的豐富,而非原創。」

從數據上而言,百家號則在逐漸成為廣告營銷的一大陣地。1月23日,在2019百家號創作者盛典上,百家號官方稱其日活達到1.6億,信息流日均推薦量超150億,百家號內容創作者超190萬,而伴隨這些數據成長的,是其廣告收入增加160%。

圍繞關於百家號的指責,百度方面1月23日向21世紀經濟報導記者回應稱,百家號是提升百度App內容生態體驗的一個重要舉措,可以優化用戶使用百度App搜索時遇到的頁面訪問速度慢、排版差異大等瀏覽體驗問題。現有的190萬百家號創作者,覆蓋了全部的權威媒體和資訊機構。

同時,百度強調,目前其搜索結果中,百家號內容全站佔比小於10%。

生態窘境

百度產品尤其是百家號當今的境況,源於百度兩年前的戰略決策。

在今日頭條、騰訊旗下企鵝媒體平臺以超高補貼吸引內容創作者入駐後,2016年,百度火速上線百家號,並於當年11月宣布「百億計劃」,計劃在2017年累計向內容生產者分成100億。

彼時,時任百度副總裁陸復斌在接受21世紀經濟報導記者採訪時放下豪言,「百度正加速打造以百家號為核心的內容生態體系。」據陸復斌介紹稱,百度將打通百度聯盟和百家號,百度知道、百度百科等內容產品也將入駐百家號,形成包括知道、百科、貼吧、文庫等一系列資源調度整合的內容平臺。

「以百家號為核心」,由此可見百度內部對百家號的重視程度。事實上,百度以實際行動證明了這一點。「確實將百家號的權重提上來了,尤其是新聞資訊類的內容。」江琳向記者透露。這也是近來多位用戶搜索內容優先看到百家號的原因。

從一定程度上而言,這是百度的無奈之舉。「中國網際網路本身就是一個不公平的地方,阿里屏蔽百度,微信公眾號內容只開放給搜狗去搜索,百度要是不做自己的內容,不將流量導向自己,怎麼競爭?」一位長期關注百度公司的資深分析人士向21世紀經濟報導記者直言道。

1月23日,圍繞百家號的諸多爭議,百度副總裁沈抖亦坦言稱,移動網際網路時代,APP都是獨立的個體,相互連接非常困難,比較割裂。因此百度才提出了百家號和小程序等行業解決方案扭轉局面。

但問題在於,一方面,百度自家內容質量存在諸多問題,從而深度影響了用戶體驗。另一方面,除了微信公眾號、淘寶等未向百度開放的內容之外,網際網路上還有海量的內容。

「除了這些大平臺,百度其實還是有非常豐富的選擇的,例如門戶網站、權威媒體網站甚至知乎、豆瓣等內容網站,它們完全開放讓百度檢索收錄,百度為何不給他們多一些流量?」有用戶向21世紀經濟報導記者直言道。

因此在該用戶看來,百度頗有「圈地為王」的趨勢,而這背離了搜尋引擎的本質。「如果用戶在使用一個搜尋引擎時,無法找到他想要的有效信息,那它就不再是一個搜尋引擎了。」

這也正是江琳逃離百度的最主要原因。在她看來,百度最大的問題是算法,而其背後又有自家產品的保護意識,最終導致用戶體驗的坍塌。

「比如在谷歌上搜索文件,如果後綴選擇pdf,就會按照這個規則出結果,百度則搜不出來,」江琳直言道,「這一方面是最初建模時沒有考慮到相關文件的搜索,無法抓取用戶需求,另一方面為了保護自家產品,希望用戶去百度文庫,就將其他結果降權了。」

而百度無條件向自家產品引流的結果,或許短期內可以實現信息流相關廣告的業績增長,但長期而言無異於將用戶推離自己。

根據美國網站通訊流量監測機構數據顯示,2018年12月,百度在中國搜尋引擎市場佔有率超過70%,而全球市佔率僅有1%。當前,在中國大陸,百度在內容上面臨騰訊、今日頭條等鉗制,搜索本身則遭遇騰訊、搜狗、必應等對手的正面競爭。因此,多位分析人士向21世紀經濟報導記者表示,並不看好百度的未來。

本文來源:21世紀經濟報導 責任編輯: 喬俊婧_NBJ11279

相關焦點

  • 逃離百度
    逃離百度江琳(化名)曾經做過很長時間的搜尋引擎優化(Search Engine Optimization,SEO),對於百度搜索的規則了如指掌。她也一度是百度的擁躉,不僅是其忠實用戶,甚至在百度因競價排名屢陷風波時,她也認為一定程度上作為平臺方「技術無罪」,技術反映的只是人性。
  • bing搜尋引擎與百度 - CSDN
    全球最大的中文搜尋引擎百度公司與微軟公司共同宣布雙方展開戰略合作。百度並將成為中國市場上Windows 10 Microsoft Edge瀏覽器的默認主頁和搜尋引擎。也就是說,將來人們在win10的Microsoft Edge瀏覽器起始頁中可以直接使用百度進行搜索。
  • 作為搜尋引擎,谷歌在中國為什麼競爭不過百度?
    谷歌簡介:Google成立於1997年,幾年間迅速發展成為目前規模最大的搜尋引擎,並向Yahoo、AOL等其他目錄索引和搜尋引擎提供後臺網頁查詢服務。目前Google每天處理的搜索請求已達2億次!而且這一數字還在不斷增長。Google資料庫存有30億個Web文件。屬於全文(Full Text)搜尋引擎。
  • 百度搜尋引擎蜘蛛喜歡什麼樣的網站結構?
    目前人們經常用的搜尋引擎是谷歌和百度,在國內佔據絕對優勢的當之無愧的是百度,而且各位站長做搜尋引擎優化的時候也主要是針對百度進行優化,希望能在百度獲得好的排名、更多優質低價的流量,這個前提就是網站得有好的結構,百度蜘蛛才能順利
  • 百度屏蔽門事件背後:警惕搜尋引擎的霸權擴張
    百度屏蔽門事件背後:警惕搜尋引擎的霸權擴張 2008年12月01日 11:18 來源:廣州日報 人們對於能否通過百度搜尋引擎獲得公正而客觀的信息充滿質疑。  「屏蔽門事件」告誡我們,要警惕這樣的威脅:由技術權力的合理追求轉向經濟權力的貪婪追求,繼而轉向社會控制力的越界追求。警惕搜尋引擎的霸權擴張。深入一點說,只有我們有意識地去防範搜尋引擎對信息權力的濫用,我們才有可能構建一個健康的社會,一個公平、祥和、有秩序、有嚴肅道德底線的網絡社會。如何抵禦搜索霸權?
  • 全球10大搜尋引擎,除了Google和百度,你還知道哪個?
    4.百度終於輪到全球最大的中文搜尋引擎——百度,作為中國最大的搜尋引擎,百度的月獨立訪客量達到了4.8億,隨著在搜尋引擎中的成功,百度逐漸拓展到地圖、金融、音樂、團購等多個領域,成為一家網際網路綜合公司。
  • 技術目前停滯不前 搜尋引擎的未來在哪裡
    《技術目前停滯不前 搜尋引擎的未來在哪裡》文章已經歸檔,不再展示相關內容,編輯建議你查看最新於此相關的內容:谷歌開源TensorFlow系統 背後都有什麼門道?通過將所有工具開源,TensorFlow能夠讓開發人員打造出高度智能化的產品。深度學習算法人工智慧並不是什麼新奇的概念。在1956年的一次大會上,資訊理論之父克勞德·艾爾伍德·香農(Claud你那麼醜,怪臉還是怪身材?
  • 百度搜索都是廣告!不如試試這幾個搜尋引擎
    閒話少敘,今天爆哥給大家聊聊搜尋引擎那些事兒眾所周知,百度是國內搜尋引擎中的老大,但由於長期位於霸主之位,居安而不思危,終於日日頹廢而漸漸式微,大家也送給它一個「名副其實」的稱號——「百毒」還記得「搜尋引擎百度已死」這篇文章嗎?
  • 愛可信新業務聯手全球最大中文搜尋引擎百度
    同時,愛可信已與全球最大的中文搜尋引擎百度達成協議,雙方將在產品、技術等方面展開一系列戰略合作。通過與百度進行合作,NetFront Life系列應用服務功能將得到進一步增強,從而為愛可信全新商業模式的成功開啟提供了支持。     NetFront Life是愛可信面向終端用戶開發的一個產品系列,凝結了愛可信在移動軟體領域多年積累的經驗和技術。
  • SEM(搜尋引擎營銷)與SEO(搜尋引擎優化)的區別
    今天講講SEM(搜尋引擎營銷)與SEO(搜尋引擎優化)這兩個網際網路術語的區別 1、金錢成本 SEM需要在百度開通競價帳戶,所以跟百度打交道必須要出成百上千的血。 SEO看看百度每次發布的算法升級公告和百度搜索優化公告即可,這一切都是免費的。
  • 百度回應搜尋引擎填報志願事件 已提供標識認證
    中關村在線消息:北京時間6月26日,今天在網際網路上山西省招生考試管理中心發布了一條提醒,表示考生在填報志願時不要使用搜尋引擎來搜索網上填報志願系統網頁,否則可能會進入錯誤的網站。今天下午,百度就此事進行了回應。
  • 搜尋引擎機制原理及規則分解
    ,作為商業公司,百度賺錢是無可厚非的。但我們客觀上說百度搜索無論是早期還是現在,都給搜索用戶提供了問題解決方案。下面我們就重點來說說百度等搜尋引擎的機制原理。但是對於那些完全的採集內容,搜尋引擎是會識別到並且會丟棄的,即便採集的內容通過初步審核,但在後續的綜合評估中也不會得到好的評分。所以,我們在網站內容建設的時候,就需要注意頁面內容的質量。另外搜尋引擎會對網站有整體的印象,如果搜尋引擎抓取到某網站的內容多半是有價值的,那麼在後續的抓取中就會首先認為該站的內容有價值。
  • 新手對搜尋引擎優化seo誤區解讀
    優化工作不是一個一成不變的工作,他需要優化人員時時刻刻去尋找和優化用戶體驗的過程,而不是時時刻刻去研究百度,不要天天抱著大姨媽理論,百度不是每個月都大姨媽,那些所謂的姨媽理論已經不適合現在的優化方式了,在大數據已經普及的現在,搜尋引擎的算法更新是時時刻刻的,而唯一不變的是用戶體驗的提升,所以我們無論是在做白帽優化
  • SEO人員,為什麼要經常關注百度搜索資源平臺?
    這並沒有什麼問題,但我們經常會忽略一些「百度搜索」的搜尋引擎優化指南,實際上,如果我們可以稍加注意,對於我們的優化工作可謂如虎添翼,特別是我們在做數據資源提交的時候。 那麼,SEO人員,向搜索資源平臺提交數據注意事項有哪些?
  • 百度「垃圾化」網民雷達:技術品牌不如3000元?
    百度「垃圾化」網民雷達:技術品牌不如3000元?  記者 唐貴江  思維互動網站網民雷達被百度「垃圾化」,至今仍未終止。時間至昨日,網民雷達依然被百度「垃圾化」。  據網民雷達說,該網站在今年一月曾被迫成為百度的競價排名用戶,交納了3000元,連結才出現在首頁第一。問題是,如果按照網際網路搜尋引擎的技術標準,名稱具有唯一性的網民雷達,本來就應該出現在搜索結果的首頁第一,不應該交納一分錢。
  • 搜尋引擎不該成為侵犯版權的「替罪羊」
    同樣的案件,百度勝訴了。2005年8月,包括四大唱片公司在內的多家唱片企業起訴百度,理由是被告在其搜索服務中未經許可提供了相關音樂作品的非法下載連結而侵犯了其合法權益。2006年11月,北京市第一中級人民法院一審駁回了唱片公司的訟訴請求。追溯到更早2001年6月,《路上的感覺》一書的著作權人葉某起訴搜狐公司的搜尋引擎可以搜到非法連結,結果敗訴。
  • 你其實並不了解的搜尋引擎蜘蛛分類
    本章主要介紹一下搜尋引擎蜘蛛都有哪些類型。了解類型之前要先知道什麼是搜尋引擎蜘蛛。百度百科上有相關解釋,天鴻用一個形象的表述重新說一下。以百度為例,大家要為什麼能在百度上搜到各類網站網頁的內容,是因為百度派出去的小弟—百度蜘蛛(baiduspider)跑到各大網站上去抓取網頁,經過層層過濾將百度認為有價值的網頁抓回自己的資料庫並進行相關性的排名,最後當用戶搜索的時候再呈現出來。但是網站極多,質量也參差不齊,對所有網站花費一樣的資源去抓取肯定也是不現實的,於是百度就搞出不同類型的蜘蛛對不同網站進行不同程度,不同廣度的抓取。
  • 南京百度|百度推廣-百度雲搜索推廣解決方案SEM Solution
    SEM搜尋引擎營銷SEM的方法包括搜尋引擎優化(SEO)、付費排名、精準廣告以及付費收錄下面有南京百度總代理商-南京首屏高健給大家分享下百度雲搜索推廣解決方案的產品概念,功能介紹,產品優勢,應用場景及接入流程
  • 從Gartner曲線看百度如何穿越技術生命周期
    但實際上經歷了多年的搜尋引擎技術積累、人工智慧技術積累、技術研發上的巨額投入,讓百度已經成為了人工智慧平臺型公司。根據國家工業信息安全發展研究中心《人工智慧中國專利技術分析報告》顯示,2019年中國人工智慧專利申請量排名中,百度以5712件位列第一。搜索、小度、無人車,更多是人工智慧技術的直觀應用,但百度在人工智慧上的布局遠遠不止這些。
  • 從百度沸點關鍵詞看2020後的技術走向
    而從百度沸點日前發布的2020年年度熱詞,我們會發現搜尋引擎的另一重價值——記錄流行語言、社會文化,投射技術的變遷與趨勢。對比百度沸點2020年與2019年的年度科技熱詞榜單,筆者發現了一些明顯的變化。