這些不可拆分的素數依然不斷展現出新的數學奧秘。
2018 年 3 月 20 日挪威科學與文學院宣布,將該年度阿貝爾獎授予美籍加拿大數學家羅伯特·朗蘭茲(Robert Langlands),以表彰他在數學領域所作出的終身成就。他提出的最終以他名字命名的數學理論「朗蘭茲綱領」(Langlands program),通過與素數的共同聯繫將幾何學、代數學和分析學等概念結合起來,在數學的眾多分支領域之間架起了「橋梁」。
羅伯特·朗蘭茲,著名的朗蘭茲綱領的提出者。
當時挪威國王將為朗蘭茲頒獎,致敬這項最新的科研成果。素數,可以說是數學領域中最龐大、最古老的數據集,數學家們歷經 2300 年的努力一直在不斷探索它的奧秘。那麼是什麼吸引無數傑出的數學家,數千年來前僕後繼地投身於素數研究中?
為了研究素數,數學家們將正整數通過素數篩選算法,直至僅剩素數保留下來。在 19 世紀,用試除法來篩選獲得了數百萬以內的素數列表。當然,現代計算機可以在不到一秒鐘的時間內找出數十億以內的素數,但所用篩法的核心思想 2000 年來從未改變。
公元前 300 年,亞歷山大裡亞的數學家歐幾裡得描述到:「素數是只能用 1 來計數的數。」這意味著素數不能被除了 1 以外的任何小於自身的數整除。並且為了保證整數的唯一分解,數學家們並不把 1 看作素數。此外,歐幾裡得還證明了素數的個數是無限的、沒有窮盡。
公元前 200 左右,古希臘數學家埃拉託斯特尼(Eratosthenes)提出了素數的快速篩選法,這是一種簡單且歷史久遠的篩法,用來找出一定範圍內所有的素數。
在 2~100 範圍內進行 2,3,5,7 篩選後留下的所有素數
埃拉託斯特尼素數篩法的思路是這樣的:首先,留下 2 ,把 2 的倍數都劃掉;2 後面第一個沒划去的數是 3 ,留下 3 ,把 3 的倍數都劃掉;然後留下 5 ,把 5 的倍數都劃掉;再留下 7 ,把 7 的倍數都劃掉。如此這般,將最小的四個質數——2,3,5,7——的倍數依次篩掉。此時,下一個未被篩掉 11 的平方已經大於 100,所以停止。這樣在 2 到 100 之間的整數隻執行這 4 次篩選,最終只留下了素數集合。
從 1 ~ 100 之間的數字中篩除 2, 3, 5 和 7 的倍數,留下就是素數 通過 8 次篩選步驟,可以分離出 400 以內的全部素數。通過 168 次篩選,可以分離出 100 萬以內的全部素數。這便是埃氏篩法的強大之處。
為素數制表的早期代表人物是英國數學家約翰·佩爾(John Pell),他致力於將有用的數字製成表格。其研究動力來源於對古希臘數學家丟番圖(Diophantos) 所提出的古老算術問題的研究熱情,還來自於對數學真理進行系統整合的個人追求。由於他的不懈努力,在 18 世紀早期 10 萬以內的素數得以廣泛傳播。截止 1800 年,各種獨立的研究項目列出了百萬以內的全部素數。
從左至右,為英國數學家約翰·佩爾,德國數學家卡爾·弗裡德裡希·興登堡,奧地利數學家雅各布·菲利普·庫利克
為了將這項繁瑣的篩選工作自動化,德國數學家卡爾·弗裡德裡希·興登堡 (Carl Friedrich Hindenburg)使用一種可調節的滑塊,可以一次性排除整張紙上的所有倍數。另一種技術含量低卻高效的方法是使用模版來定位特定素數的倍數。到19世紀中葉,數學家雅各布·庫利克(Jacob Kulik)開展了一項雄心勃勃的項目:找出 1 億以內的所有素數。但直至庫利克逝世,這些工作還沒有完成,不過已經找出來的素數填滿了 4212 頁表格.
如果不是&34;高斯(Carl Friedrich Gauss)決定對素數自身進行分析整理,19 世紀這樣一套「大數據」的結果可能也僅限於用作素數參考表。
17 世紀,對數表的誕生大大推動了天文、航海的蓬勃發展。一本作為給高斯生日禮物的對數工具書後附錄了一張300萬以內的素數表,這個在旁人看起來無實際用途的表格卻激發了他的強烈興趣。他開始著手進行數據分析統計工作。
他每次以 1000 個數為一組,分別計數這一範圍內素數的個數。先計數 1000 以內素數的個數,接著是 1001 到 2000 之間,然後是 2001 到 3000 之間,以此類推,高斯開始探索這個在旁人看來毫無樂趣的素數列表。
高斯發現,隨著數值增大,素數出現的頻率會逐漸降低,遵循「反對數」定律。雖然高斯的素數分布定理並沒有算出素數數目的精確值,但他給出了一個非常好的近似值。例如,根據素數定理預測在 1000000 到 1001000 之間存在 72 個素數,而正確結果是 75,誤差在 4% 左右。這令他提出一個猜想:
,其中
為不大於 x 的素數個數。也就說當 x 趨近無限時,有下式成立:
而在這個猜想提出一個世紀之後,這個稱之為素數定理(prime number theorem)才得到了證明。
π(x), x/lnx 和 π(x)/(x/lnx) 的比較
隨著素數計數範圍越來越大,估計值與真實值的相對誤差將趨近於 0。懸賞百萬獎金,位列當今數學界七大難題之一的黎曼猜想(Riemann hypothesis),也描述了高斯定理估算的精確程度。
素數定理和黎曼猜想已經得到了人們的廣泛關注,但它們在早期,都是從枯燥的素數表數據分析開始的。現在,我們獲取數據的方式都來自於電腦程式的運算,不再需要手算篩選,但數學家們仍在尋找素數研究的新模式。除了 2 和 5 之外,所有素數都以 1,3,7 或 9 結尾。19 世紀,人們發現這幾個末位數字在素數中存在相同的出現頻率。換句話說,如果你計數到 100 萬,25%的素數末位為 1,25% 末位為 3,25% 末位為 7,25% 末位為 9。
除了 2 和 5 之外,所有素數都以 1,3,7 或 9 結尾。19 世紀,人們發現這幾個末位數字在素數中存在相同的出現頻率。
圖表來自:The Conversation, CC-BY-ND,作者Martin Weissman
幾年前,史丹福大學的數論學家萊姆克·奧利弗(Lemke Oliver) 和坎南·桑德拉賈恩(Kannan Soundararajan)在實驗中觀察素數及其下一個相鄰素數的末位數字規律,意外發現了一個問題。例如,23 之後的素數是 29,它們的末位數字是前 3 後 9。那麼,相鄰兩個素數的末位數字,是前 3 後 9 常見,還是前 3 後 7 常見呢?
100 萬以內的連續素數末位數字對出現的頻率。相同顏色代表末位數字對具有相同的間距值。
數論學家們預計會存在一些差異,但實驗結果遠超預期。將相鄰素數末位數字對按照間距不同進行分組,譬如,23 與 29 間距為 6。結果發現,像 23 和 29 這樣前 3 後 9 的素數對兒的佔比,超過先 7 後 3 的素數對兒佔比,儘管兩種情況中相鄰素數對兒的間距都為 6。雖然數學家們很快給出了一種較為可信的解釋。但是,當涉及到連續素數的研究時,數學家們大部分還局限在分析數據進而尋找合理解釋的階段,距離揭示真相的唯一標準——數學上證明,似乎還需要很長一段路要走。(- End -)
註:本文轉載自公眾號「遇見數學」