算法下的選擇讓渡,你被算法裹挾了嗎?

2020-12-16 澎湃新聞

文/陳根

相較於傳統的物理世界,新一輪信息技術的發展使一個基於網際網路、人工智慧、大數據、區塊鏈等新興科技而形成的「數字世界」正真實而具體地嵌入我們的社會生活,深刻又廣泛地影響著我們習以為常的現實世界。

但不論是大數據還是人工智慧,都依託算法而存在,我們正在走進的數字世界本質上則是數據驅動的算法應用。當算法充斥於我們的生活,又在細微處改變著我們對信息的接收、對產品的需求以及情緒與狀態時,卻少有人關心算法最終會對我們產生的影響。

事實上,以算法為導向的思維模式,正在迅速地蔓延到自然科學和社會科學的所有領域,並滲透到我們日常生活的各個方面。它將對文化和消費者行為產生巨大影響,而任何人都需要為此做好準備。

算法基礎和算法前提

一般來說,算法是為解決特定問題而對一定數據進行分析、計算和求解的操作程序。算法,最初僅用來分析簡單的、範圍較小的問題,輸入輸出、通用性、可行性、確定性和有窮性等是算法的基本特徵。也就是說,算法是一個過程或一組規則,它可以像食譜一樣簡單,也能夠像機器學習程序代碼一樣複雜。

數學是算法的基礎之一,而且走得相當艱難。以數學演算為形式的傳統算法進化了2000多年,到18世紀才有所飛躍——德國數學家萊布尼茨發明了二進位,還設計出第一臺能做加減乘除的機械計算器。

此後200多年,隨著高斯函數、概率論、圖論、布爾邏輯及更多數學分支的發展,1930年代,二進位電子電路的問世使現代算法呼之欲出。一個叫克勞德·香農的麻省理工研究生試著把二進位和布爾邏輯結合寫進電子電路,之後他發現這種結合能解決數學難題,存儲數據,編輯圖像和文字。

1946年,世界上第一臺計算機「埃尼阿克」在美國問世。它重30噸,能用20秒計算出炮彈的軌道。從此,算法走出古典數學家的演算紙,進入計算機時代。

而數據信息則是算法存在的前提。事實上,算法的本質就是對數據信息的獲取、佔有和處理,在此基礎上產生新的數據和信息。簡言之,算法是對數據信息或獲取的所有知識進行改造和再生產。

由於算法擅長計算、數據處理和自動推理,因此,它們也成為當今數據驅動世界中極具價值的工具。於是,我們所做的一切,從吃飯到睡覺,在被數位化地跟蹤並生成數據後,算法進一步組織這些非結構化數據並將其加工成模型,以此來獲得某種具有預示性的數據結果。

以社交娛樂為例,可以說,社交媒體就由龐然大物般的算法構成。社交媒體根據人們所提供的以及來自其他各種渠道的數據,確定人們的興趣、愛好、口味,然後推送更多人們喜歡的內容。

其中,「基於內容的推薦算法」和「協同過濾算法」應用最廣,也最典型。基於內容的推薦算法在資訊閱讀領域有著基石般的存在。形象地說就是「你多看什麼就給你推薦什麼」。Feed流(信息流)是目前資訊和社交軟體最常用的展示方式,因直觀、簡單、高效等優勢深受歡迎。

早期Feed流以Timeline(時間線)排序,最經典的案例就是朋友圈。這種排序法易於理解且充滿極簡主義。但它的缺點也顯而易見,即呈現出效率低下的不良體驗。

於是,「重力排序算法」得以衍生,兼顧熱度和更新時間的綜合策略。它給內容施加兩種力:「重力」和「拉力」。前者是時間,新內容會把老內容刷下去。後者則代表點擊數、評論、贊等「熱度」,又會把熱點內容推上去。如此往復,用戶將看到一種「既新又熱」的動態平衡。

「協同過濾算法」則主要基於人際關係和興趣關聯的推薦方案。值得一提的是,協同過濾最終不是在資訊而是在電商領域發揮了最大價值。

「尿布—啤酒」的銷售案例就是協同過濾的經典應用。沃爾瑪分析消費者購物行為時發現,男性在買嬰兒尿片時都會順手犒勞自己幾瓶啤酒。於是,兩種看似風馬牛的東西,通過大數據和算法,捆綁銷售實現效益最大化。

 

算法的開放和狹隘

不斷擴大的算法體系包羅了萬象,興起了數據主義,數據主義(dataism)宣稱「宇宙是由數據流組成的,任何現象或實體的價值取決於它對數據處理的貢獻」。於是,在數據主義的影響下,所有的社會科學都呈現出追求理論上隱藏在我們的社會經濟活動中的算法模式的趨勢,就像所有的自然科學都在試圖解碼自然的有機算法一樣。

在「一切都是算法」的理念下,人們越來越相信算法能夠讓我們得到優化的結果,這進一步增強了數據主義的吸引力。比如,谷歌(Google)和Hopper能夠通過設計的算法跟蹤和預測機票價格來節省用戶的航空旅行費用;Spotify的算法讓用戶享受發現新音樂的樂趣,或者通過定向廣告讓人們發現曾經不知道但非常想要的產品。

甚至,算法和機器學習能被應用在疾病診斷和生物特徵跟蹤中。人工智慧(AI)在疾病診斷方面的應用日益普及,有些地方AI甚至可以提出治療方案和療法建議。 2020年1月一項研究結果顯示,通過X光片子診斷乳癌,算法的表現超過醫生。

時下,算法統治著各個領域,從時尚出版娛樂到金融保險旅行等。隨著技術的發展,很快,算法就將接管其他關鍵領域,如交通、城市規劃、醫療和教育,所有這些都將對我們的整體生活質量產生深遠的影響,而不論其是好是壞。

但問題是,當一切都建立在數據的基礎上時,隨著日常生活中所有領域逐漸被算法接管,無意識但高度智能的算法可能很快就會比我們自己更了解我們,也會誘使我們進入一個算法陷阱:提煉出最大眾的標準,呈現出同質化的經驗,並以此作為對每個人的最佳選擇。

歷史學家赫拉利表達了這方面的擔憂。他指出,大數據比我們最親近的朋友還要了解我們自己。在醫療領域,大數據不僅知道人們過往的病史,還知道人們祖先的病史,家族的基因情況,以及生活習慣等。因此,在健康方面,相比個體本身,大數據更能做出恰當的決定。

在情感生活領域、職場領域等都存在同樣的情況,消費領域自不待言。顧客走到一個貨架前,會拿起哪些商品來查看,比較哪幾個品牌,最終買下哪件商品,大數據都能做出可靠的預測。

這似乎只是傳統消費行為學、社會學的延伸。然而,法蘭克福學派卻更早就對商業社會的媒介霸權做出了警告和批判,馬爾庫塞認為,傳播媒介中的廣告等信息給人們製造出一些虛假的需要,人們並不去思考自己究竟需要什麼,而是被媒介信息所操控,沉迷於它們所宣揚的物質世界。

於是,個體不再了解自己真正的需要,而是被給予需要,人們的決定並不真正由自己做出。每一個登錄亞馬遜網站的用戶都會看到一個定製的主頁,上面滿是亞馬遜算法根據你的購買歷史精心挑選的產品。算法在產品發現方面已經佔據了主導地位,但現在它們開始通過自動購物進一步侵蝕消費者的自由意志。

最終,數據主義和算法決策的傳播所產生的影響明顯地體現出來:它開始剝奪人們的能動性,剝奪了人們做出自由意志選擇的機會。

在線搜索中,Google根據人們輸入結果的相關性提供按其算法排名的超連結頁面,然後通過瀏覽連結,從中了解更多信息。而隨著智能揚聲器和語音助理的推廣,越來越多的搜索開始通過語音進行。與自然對話的情況一樣,語音搜索通常一次只返回一個答案,即算法認為最匹配的結果,因此極大地限制了搜索結果。於是,人們對算法及其對數據的解釋越信任,人們就越不可能質疑其作出的決定。

顯然,算法的應用使得人們更加自願和主動地讓渡自己的自由意志,同時也使得原初意義上的自由意志的決斷過程和結果被輕易地暴露出來並更容易地被影響。此外,社會系統將適應算法的存在,廣泛依賴算法來決定集體和個體事務。而社會系統的總體改變又將深刻地改變個體的生存方式,進而再一次改變自由意志的內涵。

但無論如何,當算法賦予一枚硬幣開放和狹隘兩面的同時,我們也需要有更多思考。不要認為眼前的一切都理所當然,不要習以為常,不要喪失對於正確判斷的敏銳度,這才是算法時代下的進路。

相關焦點

  • 陳根:算法下的選擇讓渡,你被算法裹挾了嗎?
    形象地說就是「你多看什麼就給你推薦什麼」。Feed流(信息流)是目前資訊和社交軟體最常用的展示方式,因直觀、簡單、高效等優勢深受歡迎。早期Feed流以Timeline(時間線)排序,最經典的案例就是朋友圈。這種排序法易於理解且充滿極簡主義。但它的缺點也顯而易見,即呈現出效率低下的不良體驗。
  • 強控制的算法,弱控制的活法
    今天,當算法大行其道時,在帶來了科技的便利和高效的同時,我們又失去了什麼? 算法下的選擇讓渡一般來說,算法是為解決特定問題而對一定數據進行分析、計算和求解的操作程序。算法,最初僅用來分析簡單的、範圍較小的問題,輸入輸出、通用性、可行性、確定性和有窮性等是算法的基本特徵。
  • 算法是什麼:計算機領域中算法的科普
    每當你使用手機、計算機、筆記本電腦或計算器時,其實都在使用算法。那麼,什麼是算法?如果你想做數學運算,比如說兩個數字相乘(不使用任何電子設備),那麼你需要在紙上做乘法。你按照一定的規則獲得正確的答案。你也可以使用耗時更少的方法來做計算。這就是算法。算法是為執行特定的任務而設計的一組指令。
  • 理論計算機有哪些特別的算法,它們的算法複雜性很高嗎?
    所以,如果我們在具體輸入的意義下比較不同的算法,往往得出不可比較的結論。比如算法A在輸入x上比算法B要快,但是在輸入y上則比算法B慢。因此,我們需要一個比較簡潔的量來衡量一個算法快慢。在理論計算機領域,最常用的標準是漸近意義下的最壞情況分析。我們看運行時間隨著輸入問題規模增長的函數,然後對於相同規模的不同輸入,我們考慮在該規模下最壞輸入的情況。
  • 輕鬆搞定,Java選擇排序算法
    前言不知不覺,今年已經大半年 時間就過去了,很多公司秋招已經開始了,然後數據結構 與算法就是公司常拿來考察同學們的基礎,今天我們一起來學習Java中最簡單的算法,叫選擇排序算法。正文選擇排序算法,是一種簡單直觀的排序算法,它的思路是每一次從待排序的數據元素中選出最小(或最大)的一個元素,存放在序列的起始位置,直到全部待排序的數據元素排完。但是注意選擇排序它是不穩定的排序方法的。
  • ID3算法
    上一篇介紹了可以用「信息增益」來對決策樹進行特徵分類,而ID3算法恰好使用了這種方式。這一篇我主要介紹一個例子,來說明ID3算法的應用。 ID3算法核心 首先,我們來看下該算法的原理。
  • 圖的最短路徑算法-Floyd算法-弗洛伊德算法
    Floyd算法又稱為插點法,是一種利用動態規劃的思想尋找給定的加權圖中多源點之間最短路徑的算法 在計算機科學中,Floyd-Warshall算法是一種在具有正或負邊緣權重(但沒有負周期)的加權圖中找到最短路徑的算法。算法的單個執行將找到所有頂點對之間的最短路徑的長度(加權)。
  • 十大編程算法
    在平均狀況下,排序 n 個項目要Ο(n log n)次比較。在最壞狀況下則需要Ο(n2)次比 較,但這種狀況並不常見。事實上,快速排序通常明顯比其他Ο(n log n) 算法更快,因為它的內部循環(inner loop)可以在大部分的架構 上很有效率地被實現出來。
  • 算法之下,以人為「資本」
    算法和大眾生活共棲共生,為用戶提供個性化定製的服務,但是算法也用娛樂化和過載的信息吞掉了我們的時間,用戶的視野可能會隨之變窄。所以,到底是個性化還是重新塑造?這個問題值得深思。最重要的是,用戶只能看到算法的結果,看不到過程。用戶端一頁一頁的推送,看起來都是用戶自行選擇的結果。
  • 給用戶配個性化海報:Netflix 的算法讓你忍不住點開推薦(下)
    編者按:當你點開Netflix為你推薦的新劇時,你也許不知道,這部劇配的海報是專門為你挑選的。幾年來,Netflix一直致力於研發它的用戶個性化推薦系統,簡單來說就是根據用戶留下的數據、經過複雜的算法框架,最終配上最可能吸引用戶點開連結的海報。那麼,這種算法框架具體是如何運行的呢?它的優勢又在哪裡?作者在文中為讀者解答。
  • 五大常用算法:一文搞懂分治算法
    ,本篇就帶你較為全面的去認識和了解分治算法。在學習分治算法之前,問你一個問題,相信大家小時候都有存錢罐的經歷,父母親人如果給錢都會往自己的寶藏中存錢,我們每隔一段時間都會清點清點錢。你可能會疑惑分治算法和遞歸有什麼關係?其實分治重要的是一種思想,注重的是問題分、治、合併的過程。而遞歸是一種方式(工具),這種方式通過方法自己調用自己形成一個來回的過程,而分治可能就是利用了多次這樣的來回過程。
  • 算法到底算什麼?
    一、法律能夠介入算法嗎?因此,如果說法律專家不具備在算法問題上的發言權,同理,算法專家也將不具備在法律問題上的知識能力。我之所以說這個回應意義有限,是因為這是一種類似於互潑髒水的論辯策略:你說我不行,我就說你也不行。然而,你說我不行,並不等於你行;我說你不行,也不等於我行。於是,論辯上的僵局就成為最終的結果:最後大家誰都不行。
  • 樂透彩算法
    7.如果你會股票的技術分析,你也可以使用MA、KDJ、MACD、BOLL、SAR等指標進行綜合分析。樂透彩算法(二)返期分析返期:是我自己取的名稱,大家大多叫它遺漏,我認為不貼切,就改了個名字,大家先暫時接受這個名字。為什麼改,慢慢就知道了。返期定義:本號碼在前一次出現的期次離當前期的期數差。
  • Java實現冒泡排序算法
    如果你還沒有看上一篇的內容,可以去看一看,應該會有所收穫。從這一篇開始,我們把每一種排序算法,從算法的思想,到代碼實現都做一個分享。那麼你準備好了嗎?我們這一篇的主角是:冒泡排序#考考你:1.你知道冒泡排序的核心思想嗎?2.你能用java實現冒泡排序嗎?3.你能寫出更優秀的冒泡排序代碼嗎?
  • ...媒體算法解析:Facebook、YouTube、Twitter如何利用算法推薦內容?
    每天,你的決策和選擇都會受到算法的影響。這些數學上的計算會影響你在亞馬遜上的購買決定、你的購物歷程,甚至是否在購物車中保留你喜歡的麥片。算法就像魔術一樣,當他們正在運行時,你完全無法識別他們。他們在你和你的任務之間悄無聲息地運作著。雖然聽起來很危險,但總的來說,算法可以為你提供幫助。社交媒體算法正在成為你所做的所有事情的核心。
  • Fisher-Yates洗牌算法!來自算法理論的創始人!
    引言 首先看一道題目:有一個大小為100的數組,裡面的元素是從 1 到 100,隨機從數組中選擇50個不重複數。 用 Math.random() * 100 ,就可以拿到一個 0 到 99 的隨機數,是不是重複50次就可以了?
  • 你不得不看的最重要的算法類型
    算法: 算法是解決問題的分步過程。一個好的算法應該在時間和空間上進行優化。不同類型的問題需要以最優化的方式解決不同類型的算法技術。世界上有很多類型的算法,但是本文將討論您必須知道的最重要和最基本的算法。
  • 如果Apple Music成功,代表算法推薦失敗嗎?
    該算法採用統計技術來分析監聽數據,做出一個你可能會喜歡的推薦,但目前還沒有算法可以匹配人的口味。Pandora:可預見的乏味Pandora,第一個音樂流媒體服務平臺,是算法應用的很好的案例。通過對「音樂基因工程」十年的努力,Pandora使用音樂專家來給歌曲標記特色,如音樂類型,使用樂器的類型、旋律、音調。
  • 全球主流社交媒體算法解析:Facebook如何利用算法推薦內容?
    在如今的世界中,算法已經成為了我們日常生活的核心。當你進行網絡搜索,滾動瀏覽社交媒體上的信息,或者從Spotify上接收到歌曲推薦時,實際上你正在被算法指導,甚至算法比你本人更了解你的消費習慣。  每天,你的決策和選擇都會受到算法的影響。這些數學上的計算會影響你在亞馬遜上的購買決定、你的購物歷程,甚至是否在購物車中保留你喜歡的麥片。
  • 短小精悍的多源最短路徑算法—Floyd算法
    在圖論中,在尋路最短路徑中除了Dijkstra算法以外,還有Floyd算法也是非常經典,然而兩種算法還是有區別的,Floyd主要計算多源最短路徑。答案是有的,這就是易寫但稍需要理解的Floyd算法。一個求多元最短路徑算法。算法介紹先看看百度百科的定義吧:Floyd算法又稱為插點法,是一種利用動態規劃的思想尋找給定的加權圖中多源點之間最短路徑的算法,與Dijkstra算法類似。