陳根:算法下的選擇讓渡,你被算法裹挾了嗎?

2021-01-18 陳根

文/陳根

相較於傳統的物理世界,新一輪信息技術的發展使一個基於網際網路、人工智慧、大數據、區塊鏈等新興科技而形成的「數字世界」正真實而具體地嵌入我們的社會生活,深刻又廣泛地影響著我們習以為常的現實世界。

但不論是大數據還是人工智慧,都依託算法而存在,我們正在走進的數字世界本質上則是數據驅動的算法應用。當算法充斥於我們的生活,又在細微處改變著我們對信息的接收、對產品的需求以及情緒與狀態時,卻少有人關心算法最終會對我們產生的影響。

事實上,以算法為導向的思維模式,正在迅速地蔓延到自然科學和社會科學的所有領域,並滲透到我們日常生活的各個方面。它將對文化和消費者行為產生巨大影響,而任何人都需要為此做好準備。

算法基礎和算法前提

一般來說,算法是為解決特定問題而對一定數據進行分析、計算和求解的操作程序。算法,最初僅用來分析簡單的、範圍較小的問題,輸入輸出、通用性、可行性、確定性和有窮性等是算法的基本特徵。也就是說,算法是一個過程或一組規則,它可以像食譜一樣簡單,也能夠像機器學習程序代碼一樣複雜。

數學是算法的基礎之一,而且走得相當艱難。以數學演算為形式的傳統算法進化了2000多年,到18世紀才有所飛躍——德國數學家萊布尼茨發明了二進位,還設計出第一臺能做加減乘除的機械計算器。

此後200多年,隨著高斯函數、概率論、圖論、布爾邏輯及更多數學分支的發展,1930年代,二進位電子電路的問世使現代算法呼之欲出。一個叫克勞德·香農的麻省理工研究生試著把二進位和布爾邏輯結合寫進電子電路,之後他發現這種結合能解決數學難題,存儲數據,編輯圖像和文字。

1946年,世界上第一臺計算機「埃尼阿克」在美國問世。它重30噸,能用20秒計算出炮彈的軌道。從此,算法走出古典數學家的演算紙,進入計算機時代。

而數據信息則是算法存在的前提。事實上,算法的本質就是對數據信息的獲取、佔有和處理,在此基礎上產生新的數據和信息。簡言之,算法是對數據信息或獲取的所有知識進行改造和再生產。

由於算法擅長計算、數據處理和自動推理,因此,它們也成為當今數據驅動世界中極具價值的工具。於是,我們所做的一切,從吃飯到睡覺,在被數位化地跟蹤並生成數據後,算法進一步組織這些非結構化數據並將其加工成模型,以此來獲得某種具有預示性的數據結果。

以社交娛樂為例,可以說,社交媒體就由龐然大物般的算法構成。社交媒體根據人們所提供的以及來自其他各種渠道的數據,確定人們的興趣、愛好、口味,然後推送更多人們喜歡的內容。

其中,「基於內容的推薦算法」和「協同過濾算法」應用最廣,也最典型。基於內容的推薦算法在資訊閱讀領域有著基石般的存在。形象地說就是「你多看什麼就給你推薦什麼」。Feed流(信息流)是目前資訊和社交軟體最常用的展示方式,因直觀、簡單、高效等優勢深受歡迎。

早期Feed流以Timeline(時間線)排序,最經典的案例就是朋友圈。這種排序法易於理解且充滿極簡主義。但它的缺點也顯而易見,即呈現出效率低下的不良體驗。

於是,「重力排序算法」得以衍生,兼顧熱度和更新時間的綜合策略。它給內容施加兩種力:「重力」和「拉力」。前者是時間,新內容會把老內容刷下去。後者則代表點擊數、評論、贊等「熱度」,又會把熱點內容推上去。如此往復,用戶將看到一種「既新又熱」的動態平衡。

「協同過濾算法」則主要基於人際關係和興趣關聯的推薦方案。值得一提的是,協同過濾最終不是在資訊而是在電商領域發揮了最大價值。

「尿布—啤酒」的銷售案例就是協同過濾的經典應用。沃爾瑪分析消費者購物行為時發現,男性在買嬰兒尿片時都會順手犒勞自己幾瓶啤酒。於是,兩種看似風馬牛的東西,通過大數據和算法,捆綁銷售實現效益最大化。

算法的開放和狹隘

不斷擴大的算法體系包羅了萬象,興起了數據主義,數據主義(dataism)宣稱「宇宙是由數據流組成的,任何現象或實體的價值取決於它對數據處理的貢獻」。於是,在數據主義的影響下,所有的社會科學都呈現出追求理論上隱藏在我們的社會經濟活動中的算法模式的趨勢,就像所有的自然科學都在試圖解碼自然的有機算法一樣。

在「一切都是算法」的理念下,人們越來越相信算法能夠讓我們得到優化的結果,這進一步增強了數據主義的吸引力。比如,谷歌(Google)和Hopper能夠通過設計的算法跟蹤和預測機票價格來節省用戶的航空旅行費用;Spotify的算法讓用戶享受發現新音樂的樂趣,或者通過定向廣告讓人們發現曾經不知道但非常想要的產品。

甚至,算法和機器學習能被應用在疾病診斷和生物特徵跟蹤中。人工智慧(AI)在疾病診斷方面的應用日益普及,有些地方AI甚至可以提出治療方案和療法建議。 2020年1月一項研究結果顯示,通過X光片子診斷乳癌,算法的表現超過醫生。

時下,算法統治著各個領域,從時尚出版娛樂到金融保險旅行等。隨著技術的發展,很快,算法就將接管其他關鍵領域,如交通、城市規劃、醫療和教育,所有這些都將對我們的整體生活質量產生深遠的影響,而不論其是好是壞。

但問題是,當一切都建立在數據的基礎上時,隨著日常生活中所有領域逐漸被算法接管,無意識但高度智能的算法可能很快就會比我們自己更了解我們,也會誘使我們進入一個算法陷阱:提煉出最大眾的標準,呈現出同質化的經驗,並以此作為對每個人的最佳選擇。

歷史學家赫拉利表達了這方面的擔憂。他指出,大數據比我們最親近的朋友還要了解我們自己。在醫療領域,大數據不僅知道人們過往的病史,還知道人們祖先的病史,家族的基因情況,以及生活習慣等。因此,在健康方面,相比個體本身,大數據更能做出恰當的決定。

在情感生活領域、職場領域等都存在同樣的情況,消費領域自不待言。顧客走到一個貨架前,會拿起哪些商品來查看,比較哪幾個品牌,最終買下哪件商品,大數據都能做出可靠的預測。

這似乎只是傳統消費行為學、社會學的延伸。然而,法蘭克福學派卻更早就對商業社會的媒介霸權做出了警告和批判,馬爾庫塞認為,傳播媒介中的廣告等信息給人們製造出一些虛假的需要,人們並不去思考自己究竟需要什麼,而是被媒介信息所操控,沉迷於它們所宣揚的物質世界。

於是,個體不再了解自己真正的需要,而是被給予需要,人們的決定並不真正由自己做出。每一個登錄亞馬遜網站的用戶都會看到一個定製的主頁,上面滿是亞馬遜算法根據你的購買歷史精心挑選的產品。算法在產品發現方面已經佔據了主導地位,但現在它們開始通過自動購物進一步侵蝕消費者的自由意志。

最終,數據主義和算法決策的傳播所產生的影響明顯地體現出來:它開始剝奪人們的能動性,剝奪了人們做出自由意志選擇的機會。

在線搜索中,Google根據人們輸入結果的相關性提供按其算法排名的超連結頁面,然後通過瀏覽連結,從中了解更多信息。而隨著智能揚聲器和語音助理的推廣,越來越多的搜索開始通過語音進行。與自然對話的情況一樣,語音搜索通常一次只返回一個答案,即算法認為最匹配的結果,因此極大地限制了搜索結果。於是,人們對算法及其對數據的解釋越信任,人們就越不可能質疑其作出的決定。

顯然,算法的應用使得人們更加自願和主動地讓渡自己的自由意志,同時也使得原初意義上的自由意志的決斷過程和結果被輕易地暴露出來並更容易地被影響。此外,社會系統將適應算法的存在,廣泛依賴算法來決定集體和個體事務。而社會系統的總體改變又將深刻地改變個體的生存方式,進而再一次改變自由意志的內涵。

但無論如何,當算法賦予一枚硬幣開放和狹隘兩面的同時,我們也需要有更多思考。不要認為眼前的一切都理所當然,不要習以為常,不要喪失對於正確判斷的敏銳度,這才是算法時代下的進路。

相關焦點

  • 算法的入門丨最基礎的排序算法,選擇、冒泡、插入
    大家在學習java的過程中一定都會接觸到排序算法,而且排序算法是編程學習的過程中最先接觸的算法。今天給大家帶來算法的一次回憶,排序算法入門的三種基礎算法——選擇排序、冒牌排序和插入排序。選擇排序選擇排序,弟中弟,最沒用的算法,時間複雜度非常之高,所以說這個算法是最沒用的算法。但是這個算法是給編程學習者帶來思路的,用來做算法入門的墊腳石是非常不錯的。排序算法的思路:過濾整個數組,將最小的數換到第一位,重複該過程,直到遍歷數組,結束程序。首先,寫一個循環遍歷數組並將數組中元素列印出來的方法。命名為print( ); 方法。
  • 算法下的我們,正在被分析和預測,你感受到了嗎?
    你看了的視頻或電影是因為西瓜視頻或愛奇藝推薦給你的嗎
  • SEO算法:巴郎深談石榴算法與算法對策
    03石榴算法的誕生關於石榴算法,最好的解釋還是給官方,下面有請我們的百度小妹出來給大家科普下石榴算法的誕生背景。百度小妹:阿咧咧!我是百度小妹,大家叫我度娘就好啦。今天由我來給大家科普下咱們官方的石榴算法的誕生背景,大家看PPT:百度官方《石榴算法》解讀
  • 選擇排序算法的通俗講解
    1 算法簡介選擇排序的思想就是在未排序序列中以此選取出目標元素按順序放置,形成有序序列。2 算法描述現有待排序列24、69、80、57、13,使用選擇排序方法進行升序排序。在這個序列中,13已經歸位,69、80、57、24是帶排序序列,如下圖所示:2> 然後處理69、80、57、24,在其中選出最小值24,與首個元素69交換,形成13、24、80、57、69序列,其中13、24是已歸位序列,80、57、69是待排序序列,如下圖所示:3> 按上述思想處理待排序序列,直到待排序序列的元素全部處理完後,整個選擇排序算法結束。
  • 走進算法:ECDSA算法如何保護你的數據(上)
    在現實工作與生活中,我們一般使用籤名的方式表達對一份重要文件的認可,而其他人通過識別你的籤名,來確定你是否已確認/同意這份文件。但是通過臨摹等方式,有些人可以偽造出相似度達99%的字跡,假裝你的籤名,這時候非專業人員可能無法分辨出,是否為你本人所籤署。
  • 加密類型:5種加密算法以及如何選擇正確的算法
    加密密鑰與加密算法一起使加密過程成為可能。並且,基於這些密鑰的應用方式,主要主要使用兩種類型的加密方法:「對稱加密」和「非對稱加密」。這兩種方法都使用不同的數學算法(即我們剛才提到的那些加密算法)對數據進行加密。常見的加密算法列表包括RSA,ECC,3DES,AES等。
  • 「算法要向善」選擇背後的倫理博弈
    健康碼、點外賣、視頻會議成為工作生活「三件套」,各種基於數位化、信息化和智能化的服務應用快速入場,社會在技術與資本的雙重博弈下正經歷結構轉型。這種轉型呈現出一種「重組」的力量,將現有的時間空間重新切割,再以一種「光電方式」重新擬定節奏、劃定規則、做出決策。
  • 詳解JAVA數據結構與算法:排序算法
    3) 常見的排序算法分類(見右圖):l算法的時間複雜度度量一個程序(算法)執行時間的兩種方法1) 事 後統計的方 法 這種方法可 行 , 但 是有兩個 問題 :一是要想對設計的算法的運行性能進行評測 , 需要 實 際運 行該程序;二是所得時間的統計量依賴於計算機的硬體、軟體等環境因 素 , 這種方式,要在同一臺計算機的相同狀態下運行
  • 輕鬆搞定,Java選擇排序算法
    前言不知不覺,今年已經大半年 時間就過去了,很多公司秋招已經開始了,然後數據結構 與算法就是公司常拿來考察同學們的基礎,今天我們一起來學習Java中最簡單的算法,叫選擇排序算法。正文選擇排序算法,是一種簡單直觀的排序算法,它的思路是每一次從待排序的數據元素中選出最小(或最大)的一個元素,存放在序列的起始位置,直到全部待排序的數據元素排完。但是注意選擇排序它是不穩定的排序方法的。
  • 年輕人會為「愛情算法」買單嗎?
    本文作者:海怪,原標題《日本準備推行AI婚配,年輕人會為「愛情算法」買單嗎?》,題圖來自:視覺中國去年《奇葩說》裡,有一期的辯題是「伴侶有個Soulmate(靈魂伴侶),我該介意嗎?」日本的年輕人會為「愛情算法」買單嗎?如果這套「愛情算法」擺在我們面前,我們該如何使用呢?「愛情算法」,究竟靠譜嗎?日本政府決定斥資20億日元引進的這套AI婚配系統,有哪些獨特之處呢?我們都很清楚,傳統的婚姻,主要就是講究個門當戶對、郎才女貌。
  • 圖的最短路徑算法-Floyd算法-弗洛伊德算法
    Floyd算法又稱為插點法,是一種利用動態規劃的思想尋找給定的加權圖中多源點之間最短路徑的算法 在計算機科學中,Floyd-Warshall算法是一種在具有正或負邊緣權重(但沒有負周期)的加權圖中找到最短路徑的算法。算法的單個執行將找到所有頂點對之間的最短路徑的長度(加權)。
  • 計算機入門必備算法——選擇排序法
    1、引言昨天我們學習了二分查找法,但是二分查找法使用的前提必須是有序的數組或者列表,(當然很多的算法都是僅在數據有序的前提下才能使用)但是在實際工作中,我們接收到的數組不可能都是有序的,那怎麼辦呢?於是乎我們就應該先對接收到的數組或者列表進行排序。今天先來介紹第一種排序方法————選擇排序。
  • 到底什麼是算法穩定幣?
    而Basis爆紅後,算法穩定幣板塊中快速出現了一系列「仿盤」,已有項目被懷疑開發團隊套現跑路,幣價跌至1美元下方後無人問津。算法穩定幣也呈現出硬幣的兩面,被喝彩和質疑裹挾。火爆表象之下,算法穩定幣能否登堂入室,還需繼續試驗才能得出結果。
  • 圖解|什麼是RSA算法
    一般認為,1024位的RSA密鑰基本安全,2048位的密鑰極其安全,RSA算法目前支持4096位長度。密鑰長度和加解密的時間是成正比的,因此我們需要根據自己的場景來選擇密鑰長度,不必追求一味長密鑰。3.2.1 密鑰生成RSA算法的密鑰是成對的,公鑰加密私鑰解密,來看下這對密鑰是如何被計算出來的。
  • 算法丨狄克斯特拉算法示例
    ②在執行狄克斯特拉算法的過程中,將不斷更新這個表。還有更便宜的換海報的途徑嗎?Rama能夠通過一些列交換得到海報,還能額外得到錢麼?答案是不能的,因為海報是Rama能夠到達的最便宜的節點,沒法再便宜啦。假設要從家裡去單位
  • KNN算法介紹
    KNN算法要注意什麼問題?無論是分類還是回歸,我們可以從中看出KNN算法的幾個關鍵點:(1)算法超參數K(2)距離度量,特徵空間中樣本點的距離是樣本點間相似程度的反映    (3)分類決策規則,少數服從多數。 其中,K值的選擇和設置距離度量是最應該注意的幾個問題。
  • 你不得不看的最重要的算法類型
    算法: 算法是解決問題的分步過程。一個好的算法應該在時間和空間上進行優化。不同類型的問題需要以最優化的方式解決不同類型的算法技術。世界上有很多類型的算法,但是本文將討論您必須知道的最重要和最基本的算法。
  • 論算法的法律規制
    可行性在可行性層面,個人數據賦權並不一定能很好回應算法決策或算法輔助決策帶來的問題。首先,個人常常無法在數據收集時作出合理判斷。在個人數據保護的現有法律制度中,一項重要的制度設計就是所謂的「告知—選擇(notice-choice)」框架:企業等相關主體在網站或產品上告知相關群體其隱私政策,再由公民個體選擇是否同意。
  • 熊貓算法對谷歌優化的意義
    熊貓算法 的版本更新和發展方向網上有很多人列了 熊貓算法 的歷次變更,但我覺得沒太大必要去做複製黏貼,很多人只會去看一眼,說一聲;哇, 熊貓算法 這麼厲害更新了這麼多版本了。沒過第二秒腦子裡什麼印象都剩不下了,連金魚都不如,金魚好歹還有7秒鐘的記憶。
  • 短小精悍的多源最短路徑算法—Floyd算法
    在圖論中,在尋路最短路徑中除了Dijkstra算法以外,還有Floyd算法也是非常經典,然而兩種算法還是有區別的,Floyd主要計算多源最短路徑。答案是有的,這就是易寫但稍需要理解的Floyd算法。一個求多元最短路徑算法。算法介紹先看看百度百科的定義吧:Floyd算法又稱為插點法,是一種利用動態規劃的思想尋找給定的加權圖中多源點之間最短路徑的算法,與Dijkstra算法類似。