神秘的首位數定理,有點讓人困惑

2020-12-15 中學數學精準輔導

對於真實世界中的大部分數據集,首位數是1的數字的數量大約是首位數是9的6.6倍,不同首位數出現的頻率遵從一個對數分布,被稱為首位數定理。這種首位數分布的非對稱性與直覺相反,在長達一個世紀的時期作為一個經驗性統計規律存在,尚未被很好解釋。

從前,天文學家在進行天文研究時,經常要使用對數表。本世紀初,有一次天文學家西蒙紐科姆在查對數表時,偶然發現了這樣的現象:對數表開始的幾頁總要比後面幾頁磨損得厲害。這說明人們在查對數表時,較多地是使用了以1為首的那幾頁。於是,紐科姆便產生了這樣一個疑問:首位數是1的自然數在全體自然數中佔有多大的比例?它是不是要比首位數是其它數字的自然數要多?人們後來把這個問題稱為「首位數問題」。

大家可能會認為這個問題是顯而易見的。因為除0以外,共有九個數字:1,2,3,4,5,6,7,8,9,用其中任何一個數字開頭的自然數,在全體自然數中的分布是均勻的,機會應該是均等的。也就是說,首位數是1的自然數應該佔全體自然數的1/9,但事實並不這麼簡單。

1974年,當時還在美國哈佛大學做研究生,後來是美國史丹福大學統計學家的珀西迪亞科尼斯,研究了這個問題,所得到的結論出乎人們的意料,首位數是1的自然數約佔全體自然數的1/3.準確一點說,這個數值應該是lg2≈0.30103。

這是怎麼一回事呢?事實上,用不同數字做首位數字,這樣的自然數的分布並不是很均勻的,也不是很規則的。首位數是1的自然數的分布規律是:

1到20之間,這樣的數有11個,它們是1,10,11,12,……,19,所以約佔1/2;

1到30之間,這樣的數同樣有11個,所以約佔1/3;

1到100之間,這樣的數同樣有11個,所以約佔1/9;

1到200之間,這樣的數有111個,它們是1,10,11,……,19,100,101,……,199,所以約佔1/2

注意到首位數是1的自然數在以上各區間的個數與這個區間的所有自然數的個數的比值,總是在1/2與1/9之間來回震蕩。迪亞科尼斯經過研究,終於運用高等數學的方法,得出這些比值的合理平均值,它就是上面所講到的lg2。

首位數定理,與其名稱相反,並非是一個嚴格的「定理」,而是一個在絕大部分自然數據集中都存在的經驗統計規律。這個規律由Newcomb S.於1881年首次發現,並由Benford F.於1938年再次獨立提出,所以也被稱為Benford定理。首位數定理是說,十進位中一個數字的首位數是d(d=1,2,.,9)的概率遵從如下的對數分布,越大的數字出現的概率越低。

簡單地說,一堆從實際生活得出的數據中,以1為首位數字的數的出現概率約為總數的三成,接近直覺得出之期望值1/9的3倍。推廣來說,越大的數,以它為首幾位的數出現的概率就越低。它可用於檢查各種數據是否有造假。

首位數定理的「神秘」性在於,雖然絕大部分自然數據集符合首位數定理,人工偽造的數據集大部分卻不滿足首位數定理,似乎自然界存在某種特殊的數據生產過程。

迪亞科尼斯當時並不知道這樣偶然地發現有什麼實際意義。後來,美國西雅圖波音航天局數學家梅爾達德沙沙哈尼在研究用計算機描繪自然景象的問題時,用上了這個結論。美國波音航天局還將這一成果用於飛機模擬器,使飛行員在不離開地面的情況下接受訓練,而能得到一種在空中飛行的實感。首位數問題的結論在科學技術上發揮了重大的作用。

另外在研究該定理在粒子物理與天體物理中的表現時發現,粒子物理中的強子寬度與壽命、脈衝星中的功率與運動等多類物理量均符合Benford分布;統計物理中的三大正則統計——玻爾茲曼-吉布斯統計、費米-狄拉克統計和玻色-愛因斯坦統計均解析滿足首位數規律。

近期,北京大學的馬伯強教授和叢明舒、李聰喬在Elsevier旗下期刊Physics Letters A上發表了一篇題為「First Digit Law from Laplace Transform」的文章,使用Laplace變換推導並解釋了首位數定理,說明首位數定理並非源於自然界某種神秘的數據生產過程,而是人類發明的進位計數系統的內在屬性,並建議首位數定理作為一個基礎數學知識被科學工作者普遍了解。

相關焦點

  • 講個道理:其實,植樹問題就是皮克定理小時候……(文末贈送神秘人物言語)
    如果你是蘇教版地區的老師或學生,那麼在五年級上冊的《釘子板上的多邊形》數學課中,你已經初步了解了皮克定理。如果你在課外學數學,那麼必定更加熟悉,皮克定理是課外數學拓展的重要內容。稍有點難的是公式末尾的減1。這個「減1」有什麼道理呢?我的理解是,因為頂點上的各個點就連一半的面積單位也不到,各損失一部分,而這些損失的部分合起來,正好是一個完整的面積單位。
  • 勾股定理神秘而美妙,它的證法多樣,其巧妙各有不同
    圖1勾股定理神秘而美妙,它的證法多樣,其巧妙各有不同,其中的「面積法」給了小聰以靈感。他驚喜地發現:當兩個全等的直角三角形如圖①或圖②擺放時,都可以用「面積法」來證明。下面是小聰利用圖①證明勾股定理的過程:將兩個全等的直角三角形按圖①所示擺放,其中∠DAB=90°。求證:a^2+b^2=c^2。證明:如圖①所示,連接DB,過點D作BC邊上的高DF,則DF=EC=b-a。
  • 羅爾定理
    下面由數學帝結合該真題,給出該定理的多種證明思路,希望能幫助同學們更加深刻形象地理解、掌握和熟練使用該定理。      【注】中值定理包括微分中值定理和積分中值定理,微分中值定理包括四個,分別是:羅爾中值定理、拉格朗日中值定理、柯西中值定理、泰勒中值定理。
  • 盤點那些讓人考前睡不著覺的可怕定理
    今天,小編將帶大家重返深淵,一起去回憶一下學生時代那些令人頭痛的各種定理。儘管如此,傅立葉變換分析起來還是十分複雜的,與之相關的時域卷積定理、頻域卷積定理等一系列相關概念,都是分分鐘把人搞暈的節奏啊。但是三角函數的誘導公式實在是太多了,而且有些公式的形式實在是很像,在時間緊迫的考場上,經常把人搞得頭昏腦脹。此外,還有那些萬能公式、積化和差、和差化積以及倍角公式的推導過程,同樣是虐我千百遍啊。
  • 哥德爾不完備定理
    庫爾特·哥德爾(Kurt Godel)數學家、邏輯學家和哲學家。哥德爾與好友愛因斯坦   這就不得不說到哥德爾在1931年證明的一個定理——「哥德爾不完備定理」,正是這個定理讓哥德爾名垂千古。這個定理的成果直接影響到了今天的人工智慧和大腦神經科學的前沿,並且也必將在未來人類的發展中起到至關重要的作用。   「哥德爾不完備定理」的主要內容可以如下表示:   在任何一個相容的形式化數學理論中,只要它可以在其中定義自然數的概念,就可以在其中找出一個命題,在該系統中既不能證明它為真,也不能證明它為假。
  • 古代的遺蹟:至今讓科學家感到困惑的5個神秘的古代遺蹟
    也許在很多人眼裡,認為科學是可以解開世界上一切未知的謎題,但是真實的情況卻並不是這樣,地球上存在著許多,即便讓科學家抓破頭皮也無法破解謎題,例如,古代流傳下來的遺蹟,雖然它們建造年代久遠,可是有一些秘密,卻超出了現代人的認知,今天小編就來聊聊,古代的遺蹟:至今讓科學家感到困惑的5個古代遺蹟背後的
  • 用相對論證明勾股定理,這個錯誤有點離譜
    網友上傳的圖片顯示,人教版八年級下冊數學自讀課本的一節內容稱,勾股定理曾經引起愛因斯坦的濃厚興趣,「愛因斯坦用相對論來證明勾股定理」,並附上用愛因斯坦的質能方程(E=mc)證明勾股定理的推算過程。勾股定理是中國古代數學的成就之一,能與愛因斯坦這樣的科學巨匠聯繫起來,不僅證明勾股定理是放之四海皆準,而且能證明一些科學的基本原理是相通的。
  • 拉格朗日中值定理
    縱觀考研數學歷史長河中,2009年的考研數學(包括數一、數二、數三)真題中的一道證明題中的第一問甚至要求證明拉格朗日中值定理。下面由數學帝結合該真題,給出該定理的三種證明思路,希望能幫助同學們更加深刻形象地理解、掌握和熟練使用該定理。首先,我們一起看一下該定理的具體內容:(拉格朗日中值定理)
  • 《費馬大定理》
    本書聚焦「一個困惑了世間智者358年的謎」——費馬大定理。在安德魯·懷爾斯證明其成立,使得費馬猜想真正成為費馬大定理之前,無數數學家為證明這一猜想不懈努力,這一簡單的定理是如何提出的,數學界為證明這一定理做了哪些努力,安德魯是如何證明其成立的,了解一個定理誕生的過程,或許我們會驚嘆,數學真是神奇!
  • 愛因斯坦真的證明過勾股定理嗎?
    這個論述的論證過程中,恐怕有兩個最讓人迷糊又「氣憤」的方法:(1)最讓人摸不著頭腦的是第一個論據,「根據相對論,大三角形的面積是E=mc^2」。這個推斷太突然,太過跳躍了,為什麼呢,因為我們都知道相對論質能方程的形式是E=mc^2,這裡的c是光速,m是物體質量,那麼怎麼就變成了圖中要求的三角形的面積了呢?
  • 柯西中值定理
    下面由數學帝結合該真題,給出該定理的多種證明思路,希望能幫助同學們更加深刻形象地理解、掌握和熟練使用該定理。     【注】中值定理包括微分中值定理和積分中值定理,微分中值定理包括四個,分別是:羅爾中值定理、拉格朗日中值定理、柯西中值定理、泰勒中值定理。
  • 託勒密定理
    今天講以他的名字命名的託勒密定理及它的證明,再講幾個由這個定理導出的有趣的結論。一、託勒密定理託勒密定理:圓內接四邊形兩條對角線的乘積等於兩對對邊乘積之和。(證明很簡單:由託勒密定理,在四邊形APBC中,PC·AB=PA·BC+CA·PB。而等邊三角形三邊相等,即AB=BC=CA,所以,PC=PA+PB。證畢。)
  • 嗯哼幼兒園畢業很難過,對老師和朋友有點不舍,對未來有點困惑!
    6月13日霍思燕在微博上發了一組一家三口的照片,配文是「今天是嗯哼幼兒園的最後一天,面對暑假和即將到來的小學,他說他很難過,捨不得老師,又有點對未來的困惑。」不過嗯哼小小的年齡就說出自己對未來有點困惑這樣的話,小編感到很哭笑不得,小編大學了都還沒有考慮這麼多,真的是輸給了一個孩子(笑哭)。霍思燕的微博下面嗯哼的媽媽粉的評論也是讓人哭笑不得,紛紛表示讓自己也更困惑點,不能輸給嗯哼。
  • 誰是第一個發現勾股定理的人? 勾股定理是怎樣推導出來的?
    誰是第一個發現勾股定理的人? 勾股定理是怎樣推導出來的?時間:2016-04-13 20:13   來源:川北在線整理   責任編輯:沫朵 川北在線核心提示:原標題:誰是第一個發現勾股定理的人? 勾股定理是怎樣推導出來的?
  • 愛因斯坦用相對論證明勾股定理,這個錯誤有點離譜
    作者:張田勘據媒體報導,近日,有網友在網上發帖稱,人教版八年級下冊數學自讀課本中有關「愛因斯坦證明勾股定理」的內容疑似出現錯誤。網友上傳的圖片顯示,人教版八年級下冊數學自讀課本的一節內容稱,勾股定理曾經引起愛因斯坦的濃厚興趣,「愛因斯坦用相對論來證明勾股定理」,並附上用愛因斯坦的質能方程(E=mc²)證明勾股定理的推算過程。
  • ...人類358年的世紀難題|安德魯·懷爾斯|數學|費馬大定理|費馬|數論
    光看這題目,先嚇退許多人,連現場的200名數學家也只有1/4能聽懂。但當時真實的場面卻是如此火爆,學者、記者擠滿了演講廳,遲到的人只能站在走廊,踮起腳透過窗戶看。他們等待的不是黑板上那些奇形怪狀、秘密麻麻的希臘字母和函數,而是一個歷史性時刻:困惑人類358年的「費馬大定理」將被最終攻克。
  • 正弦定理的證明
    ↑↑相關文章在這裡↑↑一個在高中非常常見、非常簡單的定理
  • 大話費馬大定理
    他看似簡單的一行隨筆,讓整個數學界為之努力並困惑了整整300多年,無數偉大的天才們前赴後繼,卻都無疾而終。解決費馬大定理的過程可能是整個數學史上最為驚心動魄,也是最為戲劇性的一段故事,定理本身的簡潔優雅與證明過程的艱辛與繁複形成了強烈的反差,而中間經歷的各種曲折和動人的故事更為此增添了傳奇的色彩。
  • 二項式定理的通俗解釋
    在中學數學裡,我們會經常遇到一個叫做「二項式定理(Binomial Theorem)」的知識。
  • 夾逼定理、閉域套定理,什麼時候學數學,也成了讓人臉紅心跳的事情
    嗯,還好「露」在這裡是發lu的音,要是發lou的音,讀起來就有點酸爽啊。臥槽路燕尾定理燕尾定理,因此圖類似燕尾而得名,是五大模型之一,是一個關於三角形的定理(△ABC,D、E、F為BC、CA、AB 上點,滿足AD、BE、CF 交於同一點O)。