作者:盛以宣, MDT量數 CMO
如果把你的所有數據明碼標價,這些數據能值多少錢?
一位美國藝術家 Jennifer Lyn Morone 試圖找到答案。她在美國 Delaware 州註冊了一間公司。而這間公司所提供的商品,即是她自己的數據。她將自己的醫療、隱私、社交、金融數據等全部出售,總標價為 7000 歐元。與此相類似的觀點,也出現在近日《經濟學人》發表的 「如果有人為你的數據付費」 一文中。文中構想,我們每一個人都好像是數據勞工(數據的產生者),為一個巨大的機器——人工智慧服務。數據勞工們需要更公正的工資待遇,他們應該集結起來,成立工會,為自己爭取合法權益。
數據保護與隱私洩露,可以算是2018年橫跨科技、商業、政治多個領域的熱點議題之一。Facebook 大規模數據洩露事件第一次讓公眾意識到,原來自己早已赤裸地暴露在科技公司的監視之下,當你在使用免費的服務時,科技公司向你索取的是你的物質和精神隱私,他們不僅在利用這些信息賺著大把的鈔票,還試圖左右你的情感和思想。
早已預見數據安全問題的人們不想坐以待斃。今年五月正式生效的歐盟 《一般數據保護條例 (GDPR)》,給全世界科技公司敲響了警鐘。在 GDPR 生效前後,我的郵箱在一周內收到了 163 封有關隱私保護條例的修改通知。GDPR 試圖賦予歐盟用戶對自己隱私數據的知情權和刪除權,不遵守條例的公司很可能收到高達2000萬歐元或等價於該公司全球銷售收入4%的罰單。
讓用戶獲得對自己數據的知情權和刪除權,這聽上去理所應當,但是對全世界的科技公司來說,卻很難徹底實現。自從網際網路誕生的那一刻,用戶在網絡上所產生的數據就已經與這些科技公司緊緊相連,上網購物,在搜尋引擎裡搜索關鍵詞,或者是在社交網絡上給朋友點讚,用戶的一舉一動都被」記錄在案「。這些看似零碎、毫無意義的源數據,在海量聚合起來之後,產生了意義。如果只是清空一位用戶的數據,那可能關係不大,但如果無法存儲大盤所有用戶的數據,那很多產品可能都無法正常運營下去了,因為很多產品甚至公司的決策都是基於數據的。
對於GDPR的頒布,有人說這是保護用戶隱私的第一步,是具有歷史意義的。也有人說,這是一種倒退,讓網際網路變得不再開放,限制了人工智慧甚至是整個科技行業的發展。
我認為,GDPR雖然給了用戶對數據的知情權和刪除權,但用戶仍然處於很被動的地位。用戶能做的只是在得知了自己的數據可能被使用後,再前去進行刪除或責問,或不得不放棄使用某些產品。如果要做到如一些隱私激進分子 (privacy activist) 倡導的那樣不讓自己的數據有一絲外露,可能大部分用戶都得扔掉自己的電腦、手機,甚至任何可以連上網的東西,然後住進山洞裡。
在複雜的數碼世界裡,用戶要面對大量「居心叵測」的公司,而公司也要面對海量用戶時不時的質問,這似乎是一場永遠無法結束的追討。這個世界對數據有需求,就一定會有越來越多的新辦法出現來獲取這些數據。回想傳統的電話訪談、問卷調查,又何嘗不是一種數據的收集?數據收集一直都無處不在。
其實GDPR 條例提出了一個全新的概念——「數據控制方」(data controller),
即與數據主體(個人)共享數據的組織,大部分需要經手存儲或調用用戶數據的公司都可以被歸類為數據控制方。但我認為,用戶不應當再繼續追著數據控制方跑,而應該反過來,自己做回數據的控制方,做數據的主人。
要做到這一點,到底難不難呢?
在工業革命之後,人們沉迷於生產力飛速發展給人類帶來的物質快感,甚至構想出了一個不需要勞動,高度繁榮的後匱乏(Post-scarcity)社會。在這種社會裡,商品、服務、資訊都非常豐富,可以被人們無償佔有,貨幣也將不復存在。我們在科幻作品中總是幻想機器人能承擔越來越多的體力勞動,甚至是腦力勞動。但是,目前的人工智慧,還需要海量,甚至成倍 (expotional)的數據來支持才能幫助不斷提高它的準確度和進步。而目前的現狀是,大量的數據被少數的公司所壟斷,這限制了數據量的增長,也阻礙了人工智慧的發展。另外人工智慧目前在自我無監督學習 (unsupervised learning) 的能力還十分有限,離達到普通人類兒童就能夠做到的簡單的學習能力還有很長一段路要走。
縱觀歷史,每一次的革命,其實也是基於生產關係的革命。
第一次工業革命孕育了工廠這種生產組織形式,社會裂變出兩種新的階級:工人和資本家。第二次工業革命則加速了這種生產關係的分化,資本和生產的高度集中產生了壟斷,主要產業部門大形成佔支配地位的寡頭壟斷經濟生態的格局。
半個世紀前,第三次工業革命爆發,科技成為主要驅動力,但仍然只是改變了局部生產關係。許多人認為,科技主導的第四次工業革命正在我們眼前發生,而區塊鏈被視為一項可以再次顛覆生產關係的技術。
2008年,一個名為中本聰的人發布的一篇論文,讓一小部分人對這個社會有了新的看法。從此,區塊鏈技術誕生了。
生產關係是在社會生產過程中形成的人與人的關係。其中,生產資料的所有制形式是生產關係最基本的方面,也是生產關係的基礎。而區塊鏈,則可以改變普通人與數據之間的所有關係,可以真正實現生產成果歸生產者所有,也進而產生了一種新的生產關係。
一直以來,由於一些先進的技術掌握在某些較成功的科技公司手裡,數據(生產資料)的所有權是屬於那些公司的。更準確的說,數據的所有權是屬於那些大公司的。比起大公司,小公司獲取數據的體量和速度都遠不及大型公司,他們也更難獲取用戶以及數據合作夥伴的信任。
隨著這些科技巨頭的王國越來越大,網際網路上的數據也都聚集在了這些公司手裡。當這麼多的數據只是聚集在少數人手裡,它的價值一定會升高,因為大公司壟斷了這些數據的定價權。他們名副其實,成為了數據的控制者(data controller)。
但在區塊鏈的世界裡,數據不會只是存儲在某幾家公司的伺服器上,而將安全並分布式地存放在整個網際網路中的無數個計算機上。而我們,作為數據的生產者,可以利用區塊鏈的匿名屬性參與到整個區塊鏈上的數據生態裡來,同時也不需要暴露自己的隱私信息。 個體與個體之間,公司與公司之間,交換數據的速度將變得更快,交換成本也將大大降低。
雖然區塊鏈技術發展到今天也只有幾年的時間,許多應用還未成熟,甚至這一概念還並未被更廣泛的大眾所知曉。但是我們也已經看到了 「第一批吃螃蟹的人」,他們擁抱這個全新的生產關係,試圖成為區塊鏈先鋒。行業裡正在浮現一些專注於去中心化數據存儲的區塊鏈項目,如BigchainDB, storj, IPFS 等,這些產品對數據進行去中心化、多節點、分布式存儲,可以大大提高安全性和存儲效率,用戶完全不必擔心自己的某項數據會因遭到黑客攻擊或者停電等原因而造成洩露、丟失。
除此之外,也有一些試圖讓用戶做回數據主人的產品。
來自舊金山的創業項目 MDT 量數 (https://mdt.co/cn),在2017年首次提出了去中心化的大數據經濟生態,「量數」 意在測量普通用戶貢獻匿名大數據的價值,並將其數據所產生的價值歸還給用戶,讓用戶可以「用自己的數據來挖礦」。
在這個生態內,用戶只需要像往常一樣使用自己所熟悉的產品,當用戶的數據在區塊鏈上被某些數據產品所收錄、調用,並產生交易的時候,用戶也將獲得相應的收益。區塊鏈完美地解決了數據交易中匿名和溯源無法共存的矛盾,也可以讓數據買家確保自己買到真實有效的數據。
也許你會有疑問,所謂數據的收益,數據到底能值多少錢?將 Facebook 等大公司每年的廣告收入除以所有用戶的數字,就能算出每一個用戶數據的價值了嗎?填一張問卷,就可以獲得一張20元的星巴克代金券嗎?不,人工智慧時代對數據的需求將不斷增長,而更神奇的是,數據價值的屬性即是它可以被重複利用,甚至是越多被利用、越有價值。因此,數據收益不會是一次性交易,而更像是一個長期的行為。你的數據收益可能會是一筆非常可觀的長期收入。
另一家來自美國的科技公司 Nano Vision(https://nanovision.com/),正在創建一個平臺,使世界各地的研究人員能夠共享信息,並用虛擬貨幣來激勵社區進行分子級別的生物數據的收集,以服務需要海量數據的醫藥研究行業。這一做法,也將顛覆傳統醫學行業中數據壟斷在少數機構手中的現狀。
誠然,是否願意貢獻數據這件事是因人而異的。以我自己為例,如果我的醫療數據可以幫助科學事業的進步,幫助某個疫苗的研發,同時還能獲得獎勵,我一定會是第一個加入這個生態的人。如果我的消費數據被電商平臺收集,是為了給我提供更適合我的產品,方便我的生活,我也會選擇欣然接受。但是,如果我的數據被政客拿去左右選舉的結果,甚至最終目的是影響我自己的判斷,那我會非常憤怒,並遠離這麼做的公司和平臺。但是這一切,我都希望是我自己的選擇。
我們今天所討論的,正是這樣一種對數據所有權的意識。在不久的未來,相信我們每一個人可以做到自己選擇是否貢獻數據,並且當我們為大數據所貢獻的時候,我們可以獲得應有的回報,讓這個生態可以永續地發展下去。
你願意做第一批吃螃蟹的人嗎?你願意站出來,和我一起追討自己被拖欠的數據工資嗎?