谷歌、Facebook已成數據寡頭,去中心化數據交換打破壟斷

2021-02-14 新智元


  新智元編譯  

來源:icotalknews.com

翻譯:肖琴

【新智元導讀】只有少數幾家公司能夠獲得大數據、人工智慧和機器學習的能力,可以將其轉化為產品。這造成了數據擁有者和數據貧乏者之間不平等的鴻溝,以及大數據行業的寡頭壟斷。打破寡頭壟斷的最佳方式就是「用開放數據的海洋淹沒數據豎井」。

數據是現代商業的燃料,每個公司都需要很多數據,但很少有人能負擔得起。

只有少數幾家公司能夠獲得大數據、人工智慧和機器學習的能力,可以將其轉化為產品。這造成了數據擁有者數據貧乏者之間不平等的鴻溝,以及大數據行業的寡頭壟斷(包括被稱為FANG的Facebook、Amazon、Netflix和Google)。扎克伯格、蓋茨、貝索斯等人已經成為數據大亨,無異於石油大亨洛克菲勒。

雖然AI是貪婪的數據消費者,是依賴於大量的數據發展起來的,但大多數公司要麼擁有大量潛在的數據卻沒有能使用這些數據的AI,要麼有AI算法卻沒有足夠的數據。

這是為什麼呢?主要是因為尋找擁有AI知識的人才的競爭十分激烈,成本也很昂貴,更別說AI專家。大型科技公司正以高昂的初始工資從大學直接招聘AI畢業生。成本有多高呢?舉個例子,前谷歌自動駕駛部門工程師Anthony Levandowski在離開谷歌的前一年,拿到了1.2億美元的工資和獎金。

另一方面,很多擁有AI知識的畢業生正在創辦自己的科技公司,但卻無法獲得開發產品所需的大量數據。

FANG公司已經成為數據的OPEC(石油輸出國組織)了嗎?

在網際網路時代的初期,webgraph(一種網頁相互連接的圖)是開放的,拉裡·佩奇和謝爾蓋·布林得以學習和創新,創建了谷歌公司。但從那時起,webgraph的重要性就逐漸減弱,取而代之的是社交圖(social graph)。

從60年代開始,social graph曾是一個人具有的人際網絡和人際關係的網絡效應的寫照。

然而,Facebook擁有超過20億用戶,它重新定義了 social graph,成為了最具包容性的一個 social graph,並創建了一個指數級的將個人以及他們的朋友與企業、服務、社交活動、喜惡等等聯繫在一起的網絡。而在數據經濟中,這是企業所追求的。

儘管仍然很重要,但webgraph的主要價值來源是計算網站的PageRank;擁有用戶在線偏好和傾向的詳細數據就是數字廣告商的聖杯。

Facebook的social graph可以說已經成為網絡上最賺錢的生態系統,並且與其他數據寡頭(谷歌、亞馬遜、Netflix、微軟)一樣,它具有數據網絡效應,這種效應發生在機器學習驅動的產品隨著用戶數據的增加而變得更智能時。這就在商業環境,尤其是數字廣告領域創造出一個贏家,使得其他人越來越難以參與競爭。

2015年,Google和Facebook在全球數字廣告支出中的比例達到40%。2016年第三季度,Google和Facebook佔了美國數字廣告收入增長的99%——這是有史以來的最高的比例。2017年,它們佔了美國數字廣告支出總額的63%以上。雖然Amazon和Snapchat的進入使得它們的增長速度放慢,但要打破這種數字雙寡頭壟斷局面將是非常困難的。

石油輸出國組織(OPEC)是一個由14個石油生產國組成的政府間組織,它們佔全球石油產量的44%,佔全球探明室友儲量的73%。這使得OPEC能對全球原油價格產生重要影響。

雖然沒有證據表明數據寡頭之間存在這種「卡特爾主義」,但Facebook和Google兩家公司佔有如此大的市場份額和無限量的數據供應,它們將如何影響全球數字廣告的價格呢?

「護城河」(moat)是從巴菲特的投資理論中借用的一個術語,描述了公司周圍的經濟防禦層——無論是智慧財產權(IP),品牌還是員工——護城河讓公司能在同行業中優於競爭對手。 「數據護城河」(data moats)已成為互相競爭的科技公司之間保護智慧財產權的一種形式。

數據湖泊(Data lakes)是組織內部所有部門輸入的原始數據池。這與組織內部門間相隔離的數據是不同的,這些數據不會跨部門共享。因此,一個組織可能擁有大量有關個人客戶的數據(他們的社交習慣、購買習慣、溝通習慣等),但這些數據是分散的,難以編製成完整的個人檔案。

數據湖泊以本地格式保存大量的原始數據。與將數據存儲在文件或文件夾中的分層資料庫不同,數據湖使用平面架構來存儲數據。因此,它在很大程度上是非結構化的,是非關係型的(NoSQL)數據,直到出現一個特定的問題需要使用數據查詢,才將其細化為相關的模式。

數據是一門大生意;大數據更是一筆巨大的業務。但是一個行星大小的資料庫怎麼樣?對於廣告商和AI開發人員來說,這會成為聖杯嗎?

海洋協議(Ocean Protocol)是一個去中心化的全球數據交換協議,旨在讓企業和個人可以通過本地海洋令牌購買和銷售數據,其目的是解鎖大數據,並向更多人開放AI開發。該項目背後的理念是,對集中式資料庫缺乏信任會阻止競爭者之間共享數據。

Ocean Protocol由BigchainDB的聯合創始人Trent McConaghy創立,Ocean是區塊鏈項目生態系統的一部分(見下圖),旨在將數據、計算能力和存儲去中心化和民主化,以縮小大型科技企業之間的差距。

在2016年,世界上已經產生16ZB(16zettabytes或16,000,000,000,000,000,000,000位元組)的數據,但實際上被分析的數據只有1%,而在這1%的數據中,只有少數公司有辦法優化數據。

這些項目的最終目標之一是讓人們重新控制和掌握數據,而不是試圖讓數據大亨放棄數據。

去中心化數據交換可以有哪些幫助?

醫療保健是可獲取外部數據的一個領域,並且將產生深遠的影響。例如,如果在大型數據集上進行測試,醫療藥物試驗對特定人群或性別的效力的偏差可能遠遠低於單一醫院或實驗室所能獲得的結果。

一項利用AI來獲得結論或為某種疾病研發有效產品的醫療項目需要1萬名患者的數據,才能獲得較低的錯誤率,這對於單一醫院來說幾乎是不可能的。去中心化的數據市場的作用就在這裡。

在測試任何軟體或算法時,保持低錯誤率是一個目標,而最簡單和最便宜的方法並不是要改進或編寫更複雜的算法,而是要在舊算法上運行大量數據,或者如Trent McConaghy所描述的那樣:「 用CSV文件替換Phds——這在2000年代使得錯誤率大大減少,有更多AI得以部署。「

自動駕駛汽車是另一個出錯率必須接近0的領域,因為我們要有足夠的信任才能把生命真正地交給計算機。據估計,需要5000億到1萬億英裡的行駛距離,才能使AI模型足夠精確,能夠用於自動駕駛汽車的生產部署。

另外,Avdex是一種去中心化的航空數據交換。

「像Google和Facebook這樣的公司意識到,如果它們將這些數據存儲起來,就會產生數據網絡效應,」McConaghy說。 「它們有更多的數據,這意味著更好的模型,這意味著更高的點擊率,帶來更多的錢。它們自稱AI公司,但其實是數據公司——是數據豎井。一旦擁有了數據豎井,企業就可以將用戶從他們自己的數據中分離出來,從而將他們從數字生活中隔離開來。AI催生了這些數據豎井。」

今天,在網際網路時代,大型科技公司的權力集中度無人能及;相比之下,微軟在90年代憑藉IE瀏覽器達到統治地位而引發的反壟斷擔憂就相形見絀了。

雖然我們並不處於洛克菲勒的壟斷時代,但數據市場的集中度介於洛克菲勒壟斷和OPEC模式之間。 正如McConaghy所說,打破寡頭壟斷的最佳方式就是「用開放數據的海洋淹沒數據豎井」。

【加入社群】

新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號: aiera2015_3  入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。

相關焦點

  • 政務數據交換共享解決方案:打破數據孤島 讓數據成為資產
    近年來,數據開放共享已成為我國開展數據治理的重要議題,中央和地方政府在數據開放共享的頂層設計和制度化建設方面邁出了創新步伐。億信華辰通過創新大數據處理技術,為新一代政務數據共享交換提供解決方案,以實現數據的統籌利用、統一接入、開放共享,形成數據存儲、交換、使用、共享的核心樞紐,推動跨地區、跨層級、跨部門的數據共享交換與應用,助推政務數據無縫共享新時代的開啟。
  • 評論丨虎牙、鬥魚、企鵝電競歸於一家,遊戲直播行業寡頭壟斷格局...
    譬如,如果經過調查確定,造成遊戲直播行業封鎖效應的原因是相關頭部企業之間實施了戰略性信息數據的交換或披露,那麼該信息交換行為就屬於應被反壟斷執法機關調查與處罰的壟斷協議行為。此處所指的戰略性信息數據是指能夠減少各個相關頭部企業在市場領域實施的經營戰略不確定性的數據。
  • IPFS將顛覆網際網路實現去中心化存儲 FIL幣價將穩步倍增
    分布式區塊鏈存儲的價值並不在於存儲大量的數據和信息,而在於成為存儲資產化數據的「保險箱」。具體地說,區塊鏈分布式存儲實質上就是將數據資源利用起來,基於區塊鏈技術的新型數據中心、新型數據平臺,通過存儲系統的分布式和智能化,真正實現信息和數據的大範圍存儲。分布式存儲系統是使數據價值最大化的數據價值傳遞的基礎平臺。
  • 谷歌在韓國推出首個雲區域數據中心
    原標題:谷歌在韓國推出首個雲區域數據中心2月19日消息:谷歌在首爾推出新的雲區域數據中心,這標誌著谷歌首次進入韓國市場,也是其在亞太地區的第八個。新網站將谷歌的雲網絡擴展到了16個國家的21個地區和64個地區。
  • 美國10州起訴谷歌:壟斷廣告業務 與Facebook勾結
    美國10州起訴谷歌:壟斷廣告業務 與Facebook勾結 驅動中國 發表於 2020-12-20 11:00:41 嫦娥五號探測器圓滿完成我國首次地外天體採樣返回任務
  • 繼Google、Facebook之後,Apple也要去臺灣彰化建數據中心了?
    《聯合報》獲得消息稱,該數據中心主要是為應對不斷增長的iTunes和Apple TV流量而建設。《聯合報》表示,蘋果公司正考慮將臺灣彰化縣作為潛在的數據中心選址地點,縣政府透露稱如果交易進展順利,預計下個月就要開展探勘工作。
  • 被指「串通」Facebook壟斷在線廣告交易 谷歌又被起訴了
    周三,由美國共和黨領導的10個州對谷歌公司發起一項新的反壟斷訴訟,指控谷歌公司濫用其對部分在線廣告市場的壟斷,並與Facebook「串通」,從而阻止競爭對手進入廣告交易平臺。
  • 南都舉辦數據治理論壇:三份報告聚焦隱私、人臉識別、網際網路壟斷
    12月22日,2020南都智庫產品發布周的第二天,由南都個人信息保護研究中心舉辦的「啄木鳥數據治理論壇」在北京召開。會上,南都個人信息保護研究中心發布三份報告——《個人信息安全年度報告》《網際網路平臺競爭與壟斷觀察報告》《移動端人臉識別應用合規報告》。
  • 百度數據報告顯示:外資品牌壟斷中國化妝品市場
    (Logo: http://www.prnasia.com/sa/20061108200349-06-min.jpg ) 目前在中國化妝品市場上,中高端市場基本上被外資壟斷,歐萊雅、寶潔、資生堂等幾家國際巨頭形成了寡頭競爭之勢。同時,通過建立合資品牌和收購本土企業,中低端市場也被外資企業漸漸佔據。
  • 擔心數據中心費電?谷歌一口氣要鋪160萬塊太陽能電池板
    從2006年第一個數據中心算起,到2016年這十年,谷歌數據中心在美國各地創造了13億美元的經濟活動,並創造了超過11000個就業崗位。除了貢獻經濟,環保也是一項重要的社會責任。谷歌芬蘭數據中心使用的是風能發電。
  • 挑戰「數據霸權」,巴克雲築起去中心化網絡
    區塊鏈+金融成了固定搭配;大家都認為區塊鏈特點是不可篡改、可追溯性,其實區塊鏈去中心化的特性更為典型。 在重新定義區塊鏈的路上,深圳巴克雲網絡科技有限公司(以下簡稱「巴克雲」)給出了更具「網際網路」思維的答案。在近日巴克雲舉辦WEB3.0+區塊鏈先行私享會上,巴克雲創始人劉智聰分享了新產品「CYFS文件系統」和「未來APP『超送』IM軟體設計」。
  • 數據合規丨為了數據安全,Facebook將如何管理第三方?
    FTC的Rohit委員也在其反對意見中表達了對50億美元的罰款未能有效震懾Facebook非法行為的憂慮,並指出FTC並沒有對Facebook的非法所得進行分析來證明50億美元罰款的合理性,而在2012年FTC卻對谷歌施加了違法所得5倍以上的處罰[9]。
  • 構建精細化運營的智慧數據中心
    IT系統的集中規模化建設與垂直化分布特徵,對基礎設施的管理提出了全新的要求,這些要求集中體現在融合統一、持續高可用、經濟性運營、可服務等方面,並已成為數據中心可持續發展的關鍵KPI,而以此為基礎的數據中心基礎設施管理(
  • 谷歌被國會拷問數據隱私 Chrome瀏覽器「頂風作惡」
    近日,就在谷歌出席國會召開的數據隱私聽證會前夕,chrome瀏覽器發布的更新版「chrome 69」卻撞上槍口,被曝利用瀏覽器默認設置強行搜集用戶數據,引發美國朝野的強烈不滿。據筆者了解,谷歌帳號是谷歌旗下網絡產品的通用帳號,從2016年開始,登錄Gmail就會自動登錄谷歌雲盤、YouTube以及谷歌地圖,等等。谷歌帳號一體化,曾引起網民的廣泛擔憂:一旦其中任何一個密碼失竊,就意味著所有關聯信息全部被盜。現在谷歌「得寸進尺」,又要將谷歌帳號與chrome自動同步,自然會引起數據安全專家的質疑。
  • 警惕高科技巨頭與大資本寡頭的利益結合—美國大選啟示之一
    曾獲得普立茲獎的記者格林·格林瓦爾德發推文說,「少數矽谷寡頭決定誰可以發言、誰不可以發言,包括美國總統。他們單方面行使這一權利,沒有標準、問責或上訴。」格林瓦爾德指出,這種作法非常有威脅性,因為科技公司不像其它公司一樣,還有競爭對手。三個月前,甚至連民主黨控制的眾議院小組委員會都明確地得出結論:臉書、亞馬遜、谷歌和蘋果公司是典型的壟斷企業。
  • 數據中心在支持5G的世界中將扮演什麼角色?
    此外,雲計算的出現強調了現代數據中心的重要性。   數據中心的角色在不斷演變。隨著邊緣活動逐漸升溫,將需要數據中心的力量來創建使數據能夠被處理的算法。在擁有物聯網的世界中,人工智慧(AI)和機器學習(ML)的重要性不可低估。數據中心在實現它方面所扮演的角色也不盡相同。   產生驅動人工智慧(AI)和機器學習(ML)所需的算法需要大量的數據處理。核心數據中心已開始部署與張量處理單元(TPU)或其他專用硬體結合在一起的功能更強大的CPU。
  • 谷歌終於卸下了偽裝?安卓手機的用戶數據,美國政府可以獲取到!
    近日,多家中外媒體報導消息稱,美國谷歌公司終於公開承認:安卓手機用戶位置數據,將提供給美國政府使用!如果毫無顧忌地對外放話,顯然是得到了美國的撐腰。同時,主導迭代的Android作業系統,似乎也給了谷歌充足的底氣?畢竟近乎壟斷!
  • 報紙合併、頻道關停、寡頭壟斷:2018迎來最大關停潮?
    這種效應在今年更為明顯,無論是子報合併、電視頻道關停亦或是視頻網站的寡頭壟斷,伴隨著媒體行業集中度走高,受眾注意力和廣告預算更加顯著地向頭部資源集中。 上半年,有消息稱,《武漢晨報》已與《武漢晚報》合併,而《武漢晨報》已改為地鐵報免費發行,重慶商報、重慶晨報、重慶晚報經營後勤也宣布合併,三報編釆年底合併。 騰訊媒拓總經理王永治曾預言,到2018年很可能有三分之二以上的紙媒將會「關停並轉」,這裡的紙媒主要是指紙質媒體的形態。
  • 1.23聖丹斯【隱私大盜】數據已超過石油成為世界上最有價值的資產
    當泡沫裡的人還在困惑這個世界怎麼會變成這樣的時候       少數這麼無聊的紀錄片 這麼大的科技隱私事件整部紀錄片沒有講到 FB到底收集了多少個人訊息 你的個人資料是如何從FB賣出 然後我覺得整部片感覺對整件事避重就輕 對拉壞的都是劍橋分析 但是他不過就是個做大數據的公司 就算他不做 FB這個靠賣個資的公司 數據就放在那 總會有其他人用來做其他事情 喔對了 臉書還要做虛擬貨幣呢 虛擬貨幣當初就是為了"隱私"跟"去中心化
  • 谷歌Fit應用更新 添加了新的健康中心和睡眠跟蹤數據
    【宅秘新聞】據外媒The Verge消息,谷歌近日宣布了其Fit行動應用程式的更新,它將引入一個新的集中式主屏幕中心,其中包含與健康相關的信息以及更多的睡眠跟蹤數據。適用於Android和iOS版本的谷歌Fit的更新將於本周開始推出,谷歌還在其Wear OS智能手錶應用中添加了新的圖塊,用於放置鍛鍊、天氣和呼吸鍛鍊。