清博大數據在多項賽事與微軟、Google、阿里、百度等團隊同臺競技並獲得:第28屆中國計算語言大會CCL2019中文幽默比賽冠軍;網際網路虛假新聞檢測2019全球挑戰賽多模態識別技術冠軍;2020年「Google QUEST Q&A Labeling」國際賽事金牌。
文章來源 | 刺蝟公社
作者 | 沈丹陽 編輯 | 石 燦
你有幻想過成為巨星嗎?
在社交網絡上大紅大紫,風靡全國的那種。
你有上億微博粉絲,每次發文都會引來千萬網友互動轉發;熱搜榜上你是常客,超話打榜更是從未輸過,有關你的大事件在網絡上討論之多,一度壓垮了伺服器;只要你開直播,圍觀人數是當紅帶貨一哥一姐的幾倍之多,觀眾刷的禮物數不勝數;最神奇的是,你永遠不會過氣…….
電視劇都不敢這麼編。在現實生活中,這怎麼可能呢?
偏偏還真有這麼一款產品,為用戶打造了一個 「虛擬社交世界」。
萬千寵愛於一身
十幾天前,一款名為Botnet的虛擬社交產品,在全球範圍內的蘋果應用商店悄悄上線了。雖然是一款社交產品,但這個平臺上真正的人類只有一個,就是使用者自己。
除了用戶本人以外,還有千百萬個對其「情有獨鍾」的機器人。每個機器人帳號都被賦予了獨特的名字和真人頭像,這些頭像來源於人工智慧對公開版權素材的隨機重組。
在好奇心的驅使下,我開始測評這款神奇的虛擬社交App。
我註冊帳號後,第一條發文是系統自動生成的新人報導貼。雖然只是簡單地打了個招呼,幾分鐘內點讚數已有48萬左右。如預想般,評論區多是機器人發來的「彩虹屁」,但其風格迥異,著實讓我吃驚了一下:有腦殘粉的告白式讚美、也有黑色幽默的調侃式讚美、還有毒舌段子手的反諷式讚美。
從產品的設計和社交功能來看,Botnet像是全球三大社交軟體的克隆集合體: Facebook的界面,Instagram的評論系統,還有Twitter自由開放的內容畫風。在這個平臺上,使用者主體被無限放大,沒有熟人發的朋友圈,也沒有陌生人發的信息流,Botnet只有一個主界面,就是以時間線排序的,用戶自己發布的內容及其與機器人的互動。
隨後我又發了一些不算好看的自拍和生活瑣碎,依舊得到了機器人們熱烈的回應,即便評論中或多或少能看到些因訓練不足而產生的「胡言亂語」,但這種「被關注度」和「一呼百應」的感覺,的確讓人心情愉悅。
更令我驚豔的是,在這種「人機互動」中,我多多少少地感受到了真實的人際社交。
在一個發文中,我寫道「沒拿到這份工作offer,因為我是女性」,本以為評論區中會出現一邊倒式的批判,例如「男女理應平等,這種有性別歧視的公司不去也罷」,但機器人們給出的反應卻是:
「這份工作本來就更適合男性,讓他們去做吧。」
「聽起來也許你更應該提升自己的能力。」
「女性本應得到尊重,社會應該提供給男女平等的機遇。」
「你的發文說明你還是太年輕啊,職場歷練得少。」
譴責聲的確存在,但也有更多差異化的聲音,真實得如同我們所處的世界。
「所有機器人的回答,都是以成千上萬的真實對話作為樣本資料庫,不斷模擬訓練出來的。」 Botnet的創始人Billy Chase在接受媒體採訪時說,他設計這款產品只是一個實驗性的探索,希望找到人工智慧在社交領域的正向應用。「無論何時都有人可以交談並且分享意見,這個世界也許就不會那麼孤單了。」
Billy同樣考慮到,某些用戶可能會不滿足於現有的點讚數和評論數,想要追求更極致的「網絡巨星」體驗。對此,Billy設置了產品內部付費功能,支付約1美元就可以讓帖子下回復的機器人數量翻倍,再支付1美元,系統會為其匹配不同搞笑風格的評論機器人。
「目前的Botnet只是最初級的版本,我沒想到有那麼多來自全球各國的用戶,這款產品肯定會繼續升級、逐步完善。」 Billy表示,產品的下載量與用戶活躍度,都遠超預期。
Botnet出現並開始流行的背後,是無數普通人的「社交失語現象」。
在真實的社交平臺中,因為發文內容平凡而缺少關注度、懼怕網絡暴力從而選擇沉默、擔心隱私被竊取而小心翼翼、為了維持「日常人設」而選擇性表達意見……
有些話,只有對著模擬人類的機器,才開得了口。
「殭屍文學」風潮的興起
這種基於大數據,利用算法程序來模擬真人社交的產品,Botnet並不算首創。類似的機器人,早在幾年前就已潛伏在國內各大社交平臺中,微博就是它們的主要「棲息地」之一。
在這裡,他們有另一個名字「殭屍號」。
殭屍號等級由低到高分為三種: 最低等的是人工批量註冊的社交帳號,沒有頭像,用戶名一般是亂碼,名副其實的「殭屍號」;中等的是通過盜取社交平臺中廢棄的帳號,保留其頭像、名稱等基本信息;高級的則是直接複製活躍的社交帳號,這種號不僅自帶頭像和用戶名,還有部分數量可觀的粉絲。
這些中高級殭屍號通過專業機器的維護,在程序算法的訓練下,可以定時點讚、轉發、評論社媒上的任意發文,通過不斷地模仿及學習,殭屍號也慢慢開始自己生產內容。
殭屍文學由此而來。
這些碎片式的、混亂的、不符合邏輯的內容,逐漸有了自己的文學風格。更神奇的是,殭屍文學得到了越來越多真實用戶的關注,有一位微博用戶直接發起了一項挑戰,內容是讓挑戰者在8首詩中辨認中哪些是殭屍號的作品,哪些是德國詩人保羅·策蘭的作品,參與者不少,可答對的實屬寥寥。
圖片來源:微博
「殭屍文學抽取的語句並沒有想像的那樣隨機,拼湊起來偶爾確實會讓人眼前一亮。」
「殭屍文學可太令人上頭了,賽博智能詩。」
「這簡直是一種超現實主義浪漫思潮,每個人都能在其中找到觸動自己的詩意。」
一眾網友對著機器隨機抓取、簡單組合後的文字,評頭論足,分析得頭頭是道。一位名為GUTS的作者更是閱盡微博上的殭屍內容,寫了一篇殭屍文學大賞。
文中,GUTS盤點了各類殭屍文學。
有現代「僵」詩,用混亂的內容和標點符號,歇斯底裡地表達情緒。
圖片來源:微博
還有魔幻主義驚悚小說,文字配圖直指食人魔,細思極恐。
圖片來源:微博
更有跨國仙鬼大戰,日本貞子碰瓷太上老君,想像力堪比哪吒對決迪迦奧特曼。
圖片來源:微博
隨著殭屍文學不斷在社交平臺上發酵,人開始為「機器」服務,一位知名的微博真人博主「殭屍文學bot」,就是專注於收集此類投稿,並將優質內容分享給眾人。2019年的最後一天,這位博主還整理出了《2019年度殭屍文學十條》,引來上萬網友互動轉發。
很多網友「屍」興一來,也學著殭屍號的文風在評論區留詩一首,人氣高的創作者被其他網友戲稱為「大屍人」。
微博上的殭屍文學風潮雖日漸興盛,但追根溯源地看,殭屍號的誕生並不光彩。
它們其實就是為世人所不齒的網絡水軍。
在流量為王的時代,社交媒體中的馬太效應愈加明顯,以微博為例,粉絲越多的明星和博主,越容易受到廣告主、品牌商的青睞,相應的商業價值水漲船高,在行業內的話語權也隨之提升,優質的資源也會慢慢向其傾斜,逐漸形成一個良性循環,而反之亦然。
看到了這種效應的某些明星和博主,便企圖用「人造流量」來達到同樣的目的,他們僱傭龐大的網絡水軍充當關注者,為自己的發文刷數據,營造出一個百萬粉絲的大V形象,以此換取廣告營銷商的青睞。
半年前,一家創業公司通過蜂群文化MCN機構,向其旗下擁有380萬粉絲的微博紅人@張雨晗YuHan投放宣傳廣告。博主將帶有軟廣的vlog短視頻發出後,一夜之間瀏覽量高達353萬次,千餘條評論中滿是對產品的喜歡和讚賞,但實際為產品帶來的轉化量卻幾乎為零。
圖片來源:微博
雖然後續經多方調查發現,這家公司賣的產品也十分「一言難盡」,本身就是一個騙子,但這件事揭露出的MCN機構流量造假、買水軍刷數據的真相卻讓各界人士感到震驚。
無獨有偶,網絡水軍真正的大買家來自「飯圈」。央視新聞曾曝光流量明星數據造假事件,畫面直指當紅明星蔡徐坤,他發布在微博上的歌曲MV轉發量過億,而該平臺的總用戶量為3.7億,相當於每三個用戶中,就有一人轉發。此數據人為操縱痕跡過於明顯,幕後刷量軟體「星源」很快被查封,飯圈中瘋狂的數據造假行為也被戳穿。
原來,為了讓自家偶像的熱度更高,「數據女工們」或耗費時間人工轉發評論與偶像相關的內容,或直接花錢,讓機器程序自動完成操作,有時為了幫明星打榜,粉絲們不得不遵循平臺複雜的規則,投入大量的人力財力,此間艱辛從周杰倫與蔡徐坤的超話打榜之戰中,便可見一般。
「綁架」全球的流量灰產
利用歪門邪道來投機取巧、牟取暴利可能是人類共同的劣根性,社交機器人被「濫用」也已然成為一個國際性問題。
在微博的國際版原型Twitter上,殭屍號也曾泛濫成災。2016年美國大選時,俄羅斯涉嫌僱用大量Twitter殭屍號向普通用戶發送郵件,以此來幹涉總統選舉結果。
據英國《金融時報》的研究報告顯示,與此次大選相關的推文中,近19%來自於Twitter殭屍號,而在選舉日當天,Twitter殭屍號發布支持川普的推文數量是支持希拉蕊推文數量的5倍。後有研究學者稱此次大選為「一場社交媒體的競選」。
一年後,真相被曝光,美國國會因此向Twitter施壓,要求其刪除社交平臺上的機器人帳號。
2018年7月,Twitter進行了史上最大的一次「殭屍號圍剿」運動,僅兩個月就清理了超7000萬個虛假帳戶。Twitter官方表示,該舉措是為了「持續性地在全球範圍重建信任」,而被清除掉的殭屍號也會從真實用戶的粉絲列表中消失。
Twitter的這一次大清洗,在國際名人圈中引起了不小的震動。
殭屍號蒸發後,美國總統川普的私人Twitter帳號瞬間掉粉40萬,從5340萬降到5300萬;前總統歐巴馬損失慘重,失去了近300萬粉絲,但是其粉絲總量依舊過億,穩佔Twitter大V榜單第三名;眾多超人氣明星也掉粉嚴重,「水果姐」凱蒂·佩裡掉粉280萬,賈斯汀·比伯掉粉300萬。路透社稱,前百名Twitter大V平均掉粉2%左右。
圖片來源:TIMES OF INDIA
大張旗鼓的圍剿運動結束後,Twitter自身同樣元氣大傷。在當時公開的第二季度財報中顯示,Twitter月度活躍用戶數不升反降,美股跌幅一度超過20%。
由此可見,利用社交機器人進行數據造假,可能並不是流量名人的自嗨行為。這一現象背後,是社交媒體平臺的樂見其成和推波助瀾,有些巨頭甚至親自下場,參與了流量遊戲。
早年間,一個名為Facebook騙局的視頻在Youtube上廣為流傳,內容主要是一位Facebook頭部創作者參與了平臺的推廣計劃,卻發現自己粉絲量增長雖快,但轉發、評論、點讚等互動數據卻毫無變化,因此懷疑新增的粉絲是Facebook平臺為其添加的殭屍粉。
以Facebook、Twitter、Snapchat為代表的一眾矽谷巨頭們,歷來就喜歡從不同程度上「美化」數據,用漂亮的報表來說服投資方使其給予更多的資金支持。於是,大眾會發現巨頭們發布的公開數據,緯度各異:Facebook總是強調自己的用戶體量最大,Twitter則經常宣傳產品的月活躍用戶,卻很少提及日活躍用戶,而Snapchat剛好相反,只公開日活用戶數,對月活用戶數隻字不提。
數據的表面越光鮮亮麗,後續反噬的力量就越強。幾大社交巨頭在近年間紛紛被爆出由於平臺流量虛假,而向廣告商賠款道歉的醜聞。
更令人擔憂的是,這些被眾人所知道的事情,也許只是全球流量灰產的冰山一角。
流量灰產的技術底層,是越來越智能化的社交機器人。
Botnet的出現和流行,也許指明了未來社交產品的發展方向:在虛擬的網絡世界中,除了人與人的互動之外,人機互動,以及機器人之間的聯動,也將成為大勢所趨。與其一味抵制機器人社交帳號,不如建立起一種機制,讓人類和機器人能夠更好地分辨彼此的身份。
讓「人氣」回歸人氣,「流量」回歸流量。
註:可通過清博輿論公號菜單欄「疫情查」了解疫情防控最新動態;公號後臺留言「疫情輿論彙編」可獲取疫情相關報告(由志願者製作提供)。