隨機性,算法,錢

2021-01-09 新浪科技

來源:創事記

歡迎關注「創事記」微信訂閱號:sinachuangshiji

文/老喻在加

來源:孤獨大腦(ID:lonelybrain)

如果說,賭場是研究隨機性最好的地方,那麼骰子則是理解隨機性最好的道具。

達·文西愛思考,愛動手,他寧可畫畫,也不寫什麼東西。(可見我在這裡寫公眾號純屬浪費時間)。

但他寫過如下「微博體」:

無生命的骨頭的迅速運動掌握著推使它運動的人的命運:擲骰子。

然而,一句話已經抵得上別人一輩子的文字。

一個扔出去的骰子,真的具有完全不可測的隨機性嗎?

拉普拉斯並不這樣認為。

他是個很奇怪的人,人品上綜合了偉大和卑微,科學上綜合了決定論和概率。

拉普拉斯對概率的理解極深,他也是貝葉斯定律的養父。

但是,這位「法國的牛頓」,認為骰子的隨機性仍然是可以「決定」的,例如:

假如有一個完美的機器手,以及一個高速的測量儀,我們其實可以在一個骰子剛出去的瞬間,根據其速度、角度、旋轉、空氣阻力、地面彈性等等已知條件,計算出骰子最後是哪一面朝上。

拉普拉斯對隨機性的理解是:那只是因為我們太蠢,對一個無所不知的「妖」而言,隨機性根本不存在。

至於隨後量子時代的徹底顛覆,我們先不說了。

教你一個好玩兒的魔術:

可預測的骰子。

一個碗裡有六個骰子,你可以隨便搖動。在你搖之前,我先預測你會搖出的六個數字之和,寫在紙上,摺疊起來。然後你隨機搖動,停止。我們數一下,六個骰子朝上的點數之和是21。打開那張紙,上面的數字正好是21。  奇怪,我為什麼可以控制六個骰子的隨機性呢?

和所有的魔術一樣,我做了手腳,並且讓你看不出來。

原理如下:

看似是六個獨立的骰子,其實是三個「雙聯」的骰子,也就是把兩個骰子粘在一起。如下圖:

相連的兩個骰子的相鄰兩面,有三種組合:

2和5,3和4,1和6。

所以,無論哪一面朝上,加起來都是7。這是利用了從1到6的數字對稱性。

於是,不管你怎麼搖,看似隨機,其實每一對粘在一起的骰子朝上的數字加起來都是7,所以三對骰子加起來數字永遠是21。

魔術,只是造成了控制隨機性的假象而已。

現實中對隨機性的控制,最典型莫過於賭場。

賭場通過賠率的設計,哪怕只有1%到3%的「微弱」優勢,也能在大數定律的強大魔力下,穩穩地把賭客口袋裡的錢吸乾。

簡單而強大的東西,其實真正理解並不容易。

大數定律就是其中的一種。

我曾經聽某著名創業平臺機構說,他們孵化出厲害公司利用的是「大數定律」。

其實不是。天使投資和VC利用的都是小概率和凸性曲線。這方面最好的文章是如何用小概率賺大錢?(更正版)

相反,現實中人們總是落在「小數定律」的陷阱。

例如扔一個標準的硬幣,假如連續10次都是正面,新賭徒會押正面,老賭徒會押反面。其實這兩個都錯了。

還有,當下好多家機構紛紛研發抗疫神藥,效果喜人,其實大多也是「小樣本偏差」而已。(基本科學常識的欠缺我們就不說了)

可是,開賭場需要特許權,我們能用隨機性幹點兒啥呢?

其實,保險公司,以及各種賣卡的公司,都是在利用隨機性背後的概率賺你的錢。

我剛到溫哥華,大約10月底的時候,去洗車。老闆慫恿我說,現在正促銷,你辦一張季度洗車卡,我給你大優惠。

優惠的確大到無法抵禦,我就乖乖地辦了。

誰曾想,溫哥華的英文名字Vancouver,有一個令人聞風喪膽的別稱:Raincouver,也就是「雨哥華」,冬天下起雨來,可謂延綿不絕。

辦了卡之後的三個月裡,我壓根兒沒機會趕在偶爾的幾個晴天裡去洗車。

每當雨刮晃動,我仿佛在擋風玻璃裡看見洗車店老闆那得意的笑容。

他對溫哥華冬季下雨概率的認知優勢,贏走了我口袋裡的錢。

類似的錯誤,我一犯再犯。幾個月前去高爾夫練習場,看買卡可以便宜不少,於是就辦了一張,結果用了一次,就怎麼也找不到了。

在北美,禮品卡是一個很大的市場,送親戚送朋友送老師,給張星巴克或者對方喜歡的某個商家的現金卡,簡單直接,皆大歡喜。

據說,這個行業最大的利潤來源,就是有相當比例收到現金卡的人,丟掉或者忘掉了。

個人丟掉某個卡是隨機的,但是統計下來,這個比例相當穩定。

1990年左右讀高中(那可是個正經的高考工廠)時,有天在男生宿舍的臥談會上,我突發奇想:

可否開一個青樓,兩邊開門,一邊接待男賓,一邊接待女賓,然後讓大家彼此服務,還能兩頭收錢。

再後來,我在微博上將此思路延展:

何謂web1.0?你開一家青樓,招聘頭牌N牌,接客,連鎖擴張;

何謂web2.0?你還是開一家青樓,不招接客員,分男賓部、女賓部,客戶來了以後,自動匹配,男賓女賓彼此服務,盡情盡力,還雙向收費;

何謂web3.0?你成了JI監會,負責為男賓女賓頒發通行證,然後開放接口,為各種2.0青樓提供基礎平臺。

但這個和隨機性有啥關係呢?

我們來看一家現在最賺錢的公司之一:頭條。

你看,頭條的內容絕大多數是別人創造的,廣告是別人投放的,花時間來刷頭條的也是別人,為什麼頭條「啥都不幹」能賺大錢?

是不是有點兒像上面說的男賓女賓互相服務還雙向收費?

當然沒這麼簡單的好事。頭條的秘密是:

個性化推薦和智能分發。

頭條算法架構師曹歡歡博士介紹道:

頭條的推薦系統,如果用形式化的方式去描述實際上是擬合一個用戶對內容滿意度的函數,這個函數需要輸入三個維度的變量。

第一個維度是內容。

頭條現在已經是一個綜合內容平臺,圖文、視頻、UGC小視頻、問答、微頭條,每種內容有很多自己的特徵,需要考慮怎樣提取不同內容類型的特徵做好推薦。

第二個維度是用戶特徵。

包括各種興趣標籤,職業、年齡、性別等,還有很多模型刻畫出的隱式用戶興趣等。

第三個維度是環境特徵。

這是移動網際網路時代推薦的特點,用戶隨時隨地移動,在工作場合、通勤、旅遊等不同的場景,信息偏好有所偏移。

結合三方面的維度,模型會給出一個預估,即推測推薦內容在這一場景下對這一用戶是否合適。

這是對男賓、oh不,是對用戶端的個性化推送,那麼對於廣告主而言呢?

頭條上投放的廣告,是通過「機器人代碼」過濾再分發出去的,因此了解「機器人」在分發過程中遵循的規則,無疑能夠加大廣告主對投放的把握。

在頭條的AD系統新建一條廣告計劃後,計劃會經過 預分配曝光、預估CTR、廣告排序、頻次過濾 這四個步驟後,才會展示在用戶面前。

(以上兩段來自知乎的錢哥。)

隨機性的豐富性,精確匹配的個性化,在頭條完美融合,形成了一個超級賺錢平臺。

定價權,對於有些平臺而言,就是「賠率調節權」。

就像央行調節利息。

光有算法還不夠,還必須有傳奇。

就像賭場總會冒出超級大贏家一樣,利用隨機性的商業平臺,也會放大平臺上贏家的賺錢效應。

淘寶達人,短視頻紅人,一夜成名的普通人......

老虎機誇張的吐幣聲音,賭場對中大獎者的超級禮遇,莫不如是。

當然,淘寶和頭條,都沒有義務保證讓平臺上的每個玩家都成為贏家。

賣家、內容創造者、廣告主,關注的是一個新平臺的「賠率」。

平臺的革新,是效率的革新,往往體現在基於「賠率」的新機會。

在中大獎者的示範作用下,在與別的競爭者的遊戲刺激下,在嘗鮮的探索下,在隨機性的誘惑下,參與者們不分晝夜,貢獻精力和智慧,乃至金錢,追逐了夢想,成就了平臺。

這也是符合自然界的進化規律和市場經濟的基本原理的。

人們需要隨機性。

在《自由選擇》一書裡,提及了在自由市場發揮個人積極性所創造的奇蹟。

米爾頓·弗裡德曼和羅斯·弗裡德曼(在1979年)為我們揭示:

正是由於華盛頓當局制定了過多的法律法規、實施了過多的政府管制、建立了過多的行政機構、花費了過多的財政預算,才使我們的自由和財富受到了侵蝕和削弱。

「一旦政府以中間人的身份插手幹預,良好的願望往往會導致悲慘的結果,對此,兩位作者也進行了細緻的考察研究。」

我們的改革開放所帶來的巨大進步,正是來自那些充滿個人積極性的自由活力,看似充滿隨機性,卻極大改善人們的生活。

最後

人間也許是無所不能的神們營造的一個沉浸式遊戲,這個遊戲提供了神所沒有、所嚮往的不可知、不可逆和隨機性。

因為無所不能的神們自己的一切盡在控制的日子是徒勞而絕望的。

這個遊戲有一個通關秘訣,就是我們經常說的一句雞湯:

選擇比努力更重要。

所謂選擇,就是去挑賠率較高的賭場,並比別人更早熟悉那個賭場的算法。

否則,不管你多努力,多麼拼命扔一個骰子,也無法讓「6」朝上的概率大於六分之一。事實上是,你越努力,越接近於「六分之一」這個讓你無法滿足的平庸結果。

我們有時候覺得自己在拼命扔手中的骰子,試圖掌控自己的命運。

殊不知自己其實就是那個骰子,在無意義地翻滾著,被隨機性所驅動著。

相關焦點

  • 隨機漫步的傻瓜——你好,隨機性
    而當初吸引我看本書的原因,幾乎是因為這個書名——《隨機漫步的傻瓜》。做外匯交易在沒有形成系統化的交易方式之前,很怕自己就是那個隨機漫步的傻瓜。所以我很想搞清楚書中隨機漫步的傻瓜到底是怎麼一回事。如果很不幸那個傻瓜真的就是自己,那我應該怎麼做!
  • 隨機性真的存在嗎?
    作者:Pradeep Mutalik翻譯:Nothing審校:Nuor客觀,完美的隨機性真的存在嗎?抑或它只是我們想像的產物?眾所周知,未來是不可預測的,生活中隨機事件隨處可見,你可以說宇宙本身就是隨機的。然而,大量的隨機事件表現出的集體行為卻可以被科學精確預測。熱擴散和布朗運動就是其中兩個例子。
  • 隨機數大家都會用,但是你知道生成隨機數的算法嗎?
    真偽隨機數 當前學界分別真偽隨機數的方法非常簡略,一句話就能說清楚, 但凡用必然的算法應用法式生產的都是偽隨機數 ,經歷物理徵象發生的隨機數才是真隨機數。也即是說計較學家們曾經證實了僅僅寄託算法是無法生產真隨機數的,也能夠以為這是一個NP疑問。
  • 深度| 為什麼隨機性對於深度學習如此重要?
    答案是他們都利用了隨機性!隨機性與資訊理論在剛剛接觸概率論與數理統計時,我十分糾結於理解隨機性的物理含義。拋一枚硬幣時,結果的隨機性來自哪裡?隨機性是否僅僅是確定性混沌?是否可以做到絕對的隨機?老實地說,我還是沒有完全弄明白這些問題。
  • 隨機森林(Random Forest)算法原理
    Leo Breiman和Adele Cutler發展出推論出隨機森林的算法。而 "RandomForests" 是他們的商標。這個術語是1995年由貝爾實驗室的Tin Kam Ho所提出的隨機決策森林(random decisionforests)而來的。
  • 騰訊AI Lab論文:用隨機象限性消極下降算法訓練L1範數約束模型
    騰訊技術工程官方號獨家編譯了論文《用隨機象限性消極下降算法訓練L1範數約束模型》(Training L1-Regularized Models with Orthant-Wise Passive Descent Algorithms),該論文被 AAAI 2018錄用為現場陳述論文(Oral Presentation),由騰訊 AI Lab獨立完成,作者為王倪劍橋。
  • 用Python實現隨機森林算法
    bagging(bootstrap aggregating 的縮寫)算法從訓練數據的樣本中建立複合模型,可以有效降低決策樹的方差,但樹與樹之間有高度關聯(並不是理想的樹的狀態)。隨機森林算法(Random forest algorithm)是對 bagging 算法的擴展。
  • 隨機性理論可能是網際網路安全的關鍵
    在一份新論文中,康奈爾大學的研究人員發現了一個問題,該問題是所有加密是否都可以破解的關鍵,以及與旨在定義和測量隨機性的數學概念的驚人聯繫。康奈爾大學計算機科學教授拉斐爾·帕斯(Rafael Pass)說:「我們的結果不僅表明密碼學具有一個自然的&39;問題,而且還表明了數學和計算機科學這兩個非常獨立的領域之間的緊密聯繫-密碼學和算法資訊理論。」
  • 快讀:《隨機漫步的傻瓜》,「搖骰子」的人生,被忽視的隨機性
    「一般來說,我們確實低估了很多事情中的隨機成分。」蘇格蘭哲學家休謨在他的《人性論》中以下述方式討論這個問題:我們看到的白天鵝數目再怎麼多,也沒辦法據以推論所有的天鵝都是白的,但是只要看到一隻黑天鵝,就足以推翻這個結論。這個問題後來以穆勒所謂的「黑天鵝問題」著稱。在我們看似必然的事情中,我們總是忽略了隨機的成分。
  • 隨機性是如何讓你虧大錢的?
    答案是:在投資中,你會遇到大量的隨機事件,而在工作中,如果你只是執行層,你工作中的隨機事件要少很多。投資有風險,「隨機性」是風險的一部分,但它跟別的風險不一樣,很多風險可以化解可以避免,但隨機性帶來的風險無法絕對避免。比如說,你完成了一個方案,提交給上司審核。這份提案中,除了無風險的常規工作,其風險來自於上司的個人偏好,以及你沒有掌握到的工作信息。
  • 機器學習十大經典算法之隨機森林
    隨機森林簡介隨機森林是機器學習一種常用的方法。它是以決策樹為基礎,用隨機的方式排列建立的,森林裡每個決策樹之間都是沒有關聯的。 在得到森林之後,當有一個新的輸入樣本進入的時候,就讓森林中的每一棵決策樹分別進行一下判斷,看看這個樣本應該屬於哪一類(對於分類算法),然後看看哪一類被選擇最多,就預測這個樣本為那一類。隨機森林可以用來進行無監督學習聚類和異常點檢測。
  • 基於RSA加密算法的隨機區塊鏈
    這是分布式網絡中隨機數生成的解決方案。在開發我們的遊戲過程中,我們需要解決一個問題,在分布式網絡中生成隨機數很複雜,現幾乎所有區塊鏈都面臨這個問題。 因此,在任何人都無法相互信任的網際網路之間,創建隨機數可以解決許多問題。
  • 量子力學的隨機性被推翻了?
    諸如「耶魯大學實驗推翻量子力學隨機性」「愛因斯坦又蒙對了」等等標題黨紛紛出現,仿佛戰無不勝的量子力學一夜之間陰溝翻船一樣,很多文青紛紛哀嘆宿命論又回來了。然而,事實真的如此?還是報導偏差歪曲了論文本意?
  • 如何實現算法中的公平性
    本文分析了算法歧視的致因,側重於數據問題給出了公平性的定義,介紹了統計均等等度量指標。文章也指出,各種算法公平性定義指標法都有其優缺點,並無法就公平性達成共識。因此,算法公平性並不能直觀看成一種數學或計算機科學問題。本文的目的是使廣大讀者切身理解根植於機器學習算法中的不公平性。為此,作者力圖以易於理解的方式闡釋概念,避免使用數學表達。希望每位讀者都能從閱讀本文受益。
  • 從決策樹到隨機森林:樹型算法的原理與實現
    基於樹(Tree based)的學習算法在數據科學競賽中是相當常見的。這些算法給預測模型賦予了準確性、穩定性以及易解釋性。和線性模型不同,它們對非線性關係也能進行很好的映射。常見的基於樹的模型有:決策樹(decision trees)、隨機森林(random forest)和提升樹(boosted trees)。
  • 謠言:量子力學隨機性被推翻了
    諸如「耶魯大學實驗推翻量子力學隨機性」「愛因斯坦又蒙對了」等等標題黨紛紛出現,仿佛戰無不勝的量子力學一夜之間陰溝翻船一樣,很多文青紛紛哀嘆宿命論又回來了。然而,事實真的如此?還是報導偏差歪曲了論文本意?
  • 謠言:量子力學隨機性被推翻了
    諸如「耶魯大學實驗推翻量子力學隨機性」「愛因斯坦又蒙對了」等等標題黨紛紛出現,仿佛戰無不勝的量子力學一夜之間陰溝翻船一樣,很多文青紛紛哀嘆宿命論又回來了。然而,事實真的如此?還是報導偏差歪曲了論文本意?
  • 負載均衡算法概述
    需要考慮兩個因素,個是要考慮調的均勻性,也就是要讓每個節點都接收到調,發揮所有節點的作,另個是要考慮調的性能,也就是哪個節點響應最快,優先調哪個節點。常見的負載均衡算法隨機算法(偽隨機)隨機算法,顧名思義就是從可的服務節點中,隨機挑選個節點來訪問。
  • 主宰全球的10大算法
    【編者按】Reddit有篇帖子介紹了算法對我們現在生活的重要性,以及哪些算法對現代文明所做貢獻最大。這個表單並不完整,很多與我們密切相關的算法都沒有提到,如機器學習和矩陣乘法,歡迎你繼續補充。如果對算法有所了解,讀這篇文章時你可能會問「作者知道算法為何物嗎?」,或是「Facebook的『信息流』(News Feed)算是一種算法嗎?」
  • 遊戲中的「真隨機」和「偽隨機」
    我們都知道,很多遊戲中都存在著隨機性,不管是MOBA遊戲、抽卡養成類遊戲、甚至是策略遊戲,都存在著隨機性,也正是因為這種「隨機性」的存在,遊戲玩家們在遇到一些事件的時候,經常會自嘲自己是「歐皇」或者是「非酋」。對計算機有所了解的人,都清楚一句話「程序是由0和1組成的」,也就是說程序中是不存在可能為0也可能為1的數據的。所以,程序也就不能自己生成「隨機」的東西。