人工智慧時代,學好數學的重要性為什麼日益突出

2020-12-05 中學數學精準輔導

隨著科技的快速發展,人工智慧的熱度越來越高。而數學知識蘊含著處理智能問題的基本思想與方法,是理解複雜算法的必備要素。在機器學習工作流程中,數學與代碼高度交織在一起,代碼通常可以根據數學直觀地構建,甚至會共享數學符號與句法。

對於大多數新手來說,弄清楚入門人工智慧需要哪些數學基礎、需要熟悉什麼框架等,都至關重要。機器學習是一個異常豐富的研究領域,有大量未解決的問題:公正、可解釋性、易用性。如同所有的學科一樣,它的基本思想不是請求式的過程,而是需要耐心地用高級數學框架思考重大難題找到解決方案。在機器學習中,不論是在算法上理解模型代碼,還是在工程上構建系統,數學都有著其重要意義。因此,要了解人工智慧,首先要掌握必備的數學基礎知識。

學校一般都會分為文科和理科,有沒有莫名地產生一些理科生似乎更聰明的感覺呢?我認為,給人們造成這種感覺的很大原因在於數學。有的孩子很喜歡算術,但升入初中、開始從算術轉向數學時就跟不上了。一旦一步跟不上,就很難重新進入數學的世界,而課程不等人,不斷地繼續往前進行。在三角函數上摔一個跟頭,還摸著傷口沒回過神來呢,微積分又呼嘯而至。

數學最恐怖的地方在於它是一門不斷累積的學問,一旦在某個地方遭遇挫折,中途出現一點點空白,就算是想要努力越過空白、學習前面的課程,也是萬萬不可能的。不認真學習、補上空白的部分,根本無法前行,成績自然也不會提高。所以,一旦數學考不及格、開始對學習數學產生厭噁心理的話,就萬事皆休。

在此,不必特意舉出谷歌、蘋果,世界頂級企業基本上都是技術公司。網絡界幕後支配者Akamai 也是如此。它們全是由美國的理工科高材生所創立,而這些公司使用的技術都需要大量的數學支撐。

在谷歌主導網際網路搜索之前, 多數搜尋引擎採用的排序方法, 是以被搜索詞語在網頁中的出現次數來決定排序——出現次數越多的網頁排在越前面。 這個判據不能說毫無道理, 因為用戶搜索一個詞語, 通常表明對該詞語感興趣。 既然如此, 那該詞語在網頁中的出現次數越多, 就越有可能表示該網頁是用戶所需要的。 可惜的是, 這個貌似合理的方法實際上卻行不大通。 因為按照這種方法, 任何一個像祥林嫂一樣翻來復去倒騰某些關鍵詞的網頁, 無論水平多爛, 一旦被搜索到, 都立刻會 「金榜題名」, 這簡直就是廣告及垃圾網頁製造者的天堂。 事實上, 當時幾乎沒有一個搜尋引擎不被 「祥林嫂」 們所困擾, 其中最具諷刺意味的是: 在谷歌誕生之前的 1997 年 11 月, 堪稱早期網際網路巨子的當時四大搜尋引擎在搜索自己公司的名字時, 居然只有一個能使之出現在搜索結果的前十名內, 其餘全被 「祥林嫂」 們擠跑了。

正是在這種情況下, 1996 年初, 谷歌公司的創始人, 當時還是美國史丹福大學 (Stanford University) 研究生的佩奇 (Larry Page) 和布林 (Sergey Brin) 開始了對網頁排序問題的研究。 這兩位小夥子之所以研究網頁排序問題, 一來是導師的建議 (佩奇後來稱該建議為 「我有生以來得到過的最好建議」), 二來則是因為他們對這一問題背後的數學產生了興趣。網頁排序問題的背後有什麼樣的數學呢? 這得從佩奇和布林看待這一問題的思路說起。

在佩奇和布林看來, 網頁的排序是不能靠每個網頁自己來標榜的, 無論把關鍵詞重複多少次, 垃圾網頁依然是垃圾網頁。那麼, 究竟什麼才是網頁排序的可靠依據呢? 出生於書香門第的佩奇和布林 (兩人的父親都是大學教授) 想到了學術界評判學術論文重要性的通用方法, 那就是看論文的引用次數。 在網際網路上, 與論文的引用相類似的顯然是網頁的連結。 因此, 佩奇和布林萌生了一個網頁排序的思路, 那就是通過研究網頁間的相互連結來確定排序。 具體地說, 一個網頁被其它網頁連結得越多, 它的排序就應該越靠前。

不僅如此, 佩奇和布林還進一步提出, 一個網頁越是被排序靠前的網頁所連結, 它的排序就也應該越靠前。 這一條的意義也是不言而喻的, 就好比一篇論文被諾貝爾獎得主所引用, 顯然要比被普通研究者所引用更說明其價值。 依照這個思路, 網頁排序問題就跟整個網際網路的連接結構產生了關係, 正是這一關係使它成為了一個不折不扣的數學問題。

思路雖然有了, 具體計算卻並非易事, 因為按照這種思路, 想要知道一個網頁 Wi 的排序, 不僅要知道有多少網頁連結了它, 而且還得知道哪些網頁各自的排序——因為來自排序靠前網頁的連結更有分量。 但作為網際網路大家庭的一員, Wi 本身對其它網頁的排序也是有貢獻的, 而且基於來自排序靠前網頁的連結更有分量的原則, 這種貢獻與 Wi 本身的排序也有關。 這樣一來, 我們就陷入了一個 「先有雞還是先有蛋」 的循環: 要想知道 Wi 的排序, 就得知道與它連接的其它網頁的排序, 而要想知道哪些網頁的排序, 卻又首先得知道 Wi 的排序。

為了打破這個循環, 佩奇和布林採用了一個很巧妙的思路, 即分析一個虛擬用戶在網際網路上的漫遊過程。 他們假定: 虛擬用戶一旦訪問了一個網頁後, 下一步將有相同的機率訪問被該網頁所連接的任何一個其它網頁。 換句話說, 如果網頁 Wi 有 Ni 個對外連結, 則虛擬用戶在訪問了 Wi 之後, 下一步點擊那些連結當中的任何一個的機率均為 1/Ni 。 初看起來, 這一假設並不合理, 因為任何用戶都有偏好, 怎麼可能以相同的機率訪問一個網頁的所有連結呢? 但如果我們考慮到佩奇和布林的虛擬用戶實際上是對網際網路上全體用戶的一種平均意義上的代表, 這條假設就不像初看起來那麼不合理了。 那麼網頁的排序由什麼來決定呢? 是由該用戶在漫遊了很長時間——理論上為無窮長時間——後訪問各網頁的機率分布來決定, 訪問機率越大的網頁排序就越靠前。

為了將這一分析數學化, 我們用 Pi(n)表示虛擬用戶在進行第 n 次瀏覽時訪問網頁 Wi 的機率。 顯然, 上述假設可以表述為 (請讀者自行證明):

Pi(n+1)= Σj Pj(n)Pj→i/Nj

這裡 Pj→i 是一個描述網際網路連接結構的指標函數 (indicator function), 其定義是: 如果網頁 Wj 有連結指向網頁 Wi , 則 Pj→i 取值為 1, 反之則為 0。 顯然, 這條假設所體現的正是前面提到的佩奇和布林的排序原則, 因為右端求和式的存在表明與 Wi 有連結的所有網頁 Wj 都對 Wi 的排名有貢獻, 而求和式中的每一項都正比於 Pj, 則表明來自那些網頁的貢獻與它們的自身排序有關, 自身排序越靠前 (即 Pj 越大), 貢獻就越大。

為符號簡潔起見, 我們將虛擬用戶第 n 次瀏覽時訪問各網頁的機率合併為一個列向量 Pn, 它的第 i 個分量為 Pi(n), 並引進一個只與網際網路結構有關的矩陣 H, 它的第 i 行 j 列的矩陣元為 Hij = Pj→i/Nj, 則上述公式可以改寫為:Pn+1 = HPn,這就是計算網頁排序的公式。

熟悉隨機過程理論的讀者想必看出來了, 上述公式描述的是一種馬爾可夫過程 (Markov process), 而且是其中最簡單的一類, 即所謂的平穩馬爾可夫過程 (stationary Markov process), 而 H 則是描述馬爾可夫過程中的轉移概率分布的所謂轉移矩陣 (transition matrix)。 不過普通馬爾可夫過程中的轉移矩陣通常是隨機矩陣 (stochastic matrix), 即每一列的矩陣元之和都為 1 的矩陣 (請讀者想一想, 這一特點的 「物理意義」 是什麼?)。 而我們的矩陣 H 卻可能有一些列是零向量, 從而矩陣元之和為 0, 它們對應於那些沒有對外連結的網頁, 即所謂的 「懸掛網頁」 (dangling page)。

上述公式的求解是簡單得不能再簡單的事情, 即: Pn = HnP0,其中 P0為虛擬讀者初次瀏覽時訪問各網頁的機率分布 (在佩奇和布林的原始論文中, 這一機率分布被假定為是均勻分布)。以上就是谷歌背後最重要的數學奧秘。

谷歌的搜尋引擎問世之後,其他搜尋引擎公司的技術人員都大為震驚:「怎麼可以做到這樣?」最初,幾乎所有人都不知道它的運行機制。電影《星球大戰》預告片全世界同步公開的時候,幾乎所有的伺服器都因為點擊率過高而崩潰,唯有Akamai 的伺服器堅挺不倒。為什麼只有谷歌可以搜索?為什麼只有Akamai 的伺服器不會崩潰?這就是令人震撼的數學能力差距所導致的技術鴻溝。

今年7月,科技部、教育部、中科院、自然科學基金委聯合印發了《關於加強數學科學研究工作方案》,要求加強數學科學研究,持續穩定支持基礎數學科學。

為何要專門發文強調數學的重要性?這是因為,作為自然科學基礎的數學,實質上也是重大技術創新的基礎,直接影響著國家實力。

現階段,幾乎所有的重大發現都與數學的發展與進步相關,數學已成為航空航天、國防安全、生物醫藥、信息、能源、海洋、人工智慧、先進位造等領域不可或缺的重要支撐。我國在很多領域研究遭遇卡脖子的困境,也和數學研究滯後有關。

因此我們可以說提高數學研究能力,可不是靠刷題能解決的。舉個例子,許多工程設計需要通過試驗來印證,但多做試驗費錢、費時,整個設計耗資大而且周期拉得很長,而且很多與國防科技相關的技術也不能輕易試驗,都要通過數學建模的方式來模擬。

我國在原子彈和氫彈的試製過程中,因為充分發揮了理論分析和數值模擬的作用,造原子彈時所用的試驗只佔西方國家的十分之一,而從原子彈到氫彈只用了二年零三個月的時間,就是數值模擬發揮了作用。

去年初,藉由中興事件引發的中國晶片之痛的追問,也可以延伸到數學研究的薄弱上。而華為則在這方面,因為早早看準了基礎理論研究的重要性,從而避免了中興曾經遭遇的窘境。華為曾在3G和2G領域的算法層面帶來了革命性突破,讓其產品在產品紅海中殺出了一條生路,靠的就是其高薪聘請的俄羅斯數學家,而俄羅斯正是世界上名副其實的數學強國。為什麼華為有700多個數學家、800多個物理學家、120多個化學家?1月17日,華為創始人兼CEO在深圳接受央視記者董倩專訪,該節目於20日晚上在央視《面對面》節目播出,這是他首次接受國內電視媒體專訪闡明這一觀點。

任正非講過一段話,說明為什麼華為要堅持投入基礎理論研究。華為現在的水平尚停留在工程教學、物理算法等工程科學的創新層面,尚未真正進入基礎理論研究。隨著逐步逼近香農定理、摩爾定律的極限,而對大流量、低時延的理論還未創造出來,華為已感到前途茫茫、找不到方向。華為已前進在迷航中。重大創新是無人區的生存法則,沒有理論突破,沒有技術突破,沒有大量的技術積累,是不可能產生爆發性創新的。

當第三次工業革命帶來的技術紅利消耗殆盡,世界經濟增長陷入低迷,數學或許能夠成為引領下一波技術創新的突破口。從這點上來看,我們真該好好想想,中國人的數學水平真的領先全球嗎?我們究竟應該怎麼學數學?

相關焦點

  • 學數學到底有什麼用?為什麼要學好數學
    我們常常說興趣是最好的老師,如果一個喜歡數學,這難道不是最好的理由嗎?很多人可能會說,本來我小時候是非常喜歡數學的,為什麼長大了這麼害怕數學呢?那麼小編想問一句:你真的是討厭數學嗎?那麼為什麼那麼多的趣味數學題目還很收大家的歡迎呢?
  • 人工智慧發展駛入快車道 時代呼喚強化數學教育
    剛剛看到阿里巴巴「達摩院」舉辦全球數學大賽的消息,讓我想起近代數學的奠基者之一、德國數學家高斯說過的一句話:「數學是『科學的皇后』」。這句話彰顯了數學在所有學科中的基礎地位,隨著人工智慧時代的臨近,人們會愈來愈深刻地感受到數學所能帶來的創新之力。
  • 學Python編程為什麼會對學好數學有幫助呢?
    2、數學模型與編程同學們有沒有想過,我們為什麼要學習數學,學習數學的目的是什麼呢?學習數學僅僅是為了認識數字,會寫會算嗎?我相信大多數同學不會贊同我的回答。我們學習數學不只是要認識數字,會寫會算,還要能通過學過的數學知識解決現實中存在的問題,將現實生活中的問題轉化為數學問題並予以解決。
  • 如何學好數學
    要學好數學這門課必須領悟以下幾點:1、要領悟數學「黃金圈思維」。具體來說,一共有三個問題值得我們去深思:第一個問題:為什麼要學數學?大家一定覺得很簡單,我是這麼理解的:數學是重要的學科,內容豐富多彩;數學是有力的工具,在很多領域起著關鍵作用;數學是長青的知識,結論具有永恆的意義;數學是關鍵的技術,所有高技術都要應用到;數學是先進的文化,影響著人類文明的進程;數學也是義務制教育裡必學的學科,影響著升學考試。
  • 政見|國際數學大師丘成桐:人工智慧時代,亟須數學理論突破
    政見|國際數學大師丘成桐:人工智慧時代,亟須數學理論突破深秋的石窟河,碧藍清幽,遠山叢林掩映其中,好似一幅極美畫卷。時隔兩年,國際數學大師、哈佛大學教授丘成桐再次踏上故土,發起卡拉比-丘(梅州蕉嶺)數學大會。日前,在接受南方日報、南方+客戶端專訪時,年過七旬的他分享了自己與祖國、與家鄉蕉嶺的點滴故事,並為中國基礎科學研究的發展和人才培育鼓與呼。
  • 華羅庚:如何學好數學
    生前曾任中國科學院數學研究所所長、中國數學會理事長、中國科技大學副校長等職。以下是他在1962年對廣東省數學會會員和中學教師的一次講話中關於「怎樣學好數學」的內容,相信對同學們學好數學會有所教益。基本運算不但應當「會」,而且要熟、要快。這樣的要求不但是為了目前的質量,而且更重要的是保證進一步學習的進度與質量,是為了運用自如。應當與「會了就可以,習題可以少做」的思想鬥爭。
  • 數學家談:如何學好數學?
    生前曾任中國科學院數學研究所所長、中國數學會理事長、中國科技大學副校長等職。以下是他在1962年對廣東省數學會會員和中學教師的一次講話中關於「怎樣學好數學」的內容,相信對同學們學好數學會有所教益。 一、基本運算要熟、要快 基本運算不但應當「會」,而且要熟、要快。
  • 臨床研究:為什麼一定要學好基礎?
    退休之年,才領悟到老師們為什麼總強調基礎的重要性。我覺悟很慢,但終是摸到了點門道,至少可以給後生們嘮叨。 什麼是基礎?所謂基礎,就是那些讓一個學科之所以成為這個學科的東西,那些萬變不離其宗的東西,那些一旦不存在了整個學科就會塌陷的東西。 為什麼說基礎很重要?
  • 2020世界人工智慧大會倒數中,人工智慧教育重要性不言而喻
    世界人工智慧產業發展藍皮書在滬發布;全球高校人工智慧學術聯盟於此成立;國內各科技企業大佬發表自己對人工智慧的展望;無一不旨在推動著人工智慧產業的發展。  而後的2019年人工智慧大會規模不斷擴大,更是以「智聯世界,無限可能」為主題,突出了人工智慧重要性,大會中「雙馬」對話、70餘個AI和5G項目籤約、AI「諾貝爾獎」、人工智慧「國家隊」擴圍……都成為其間的焦點,引領、推動著國內人工智慧的發展。
  • 基礎力學的重要性,以及力學與數學的關係
    事實上,學習任何一門課程,最重要的一點是從思想上重視這門課程,而教條式的強調用功往往並不見得有效果,所以,其核心和關鍵是要認識到這門課程的重要性,從而培養出對這門課程的興趣。為什麼走鋼絲的人需要拿一根很長的平衡杆?為什麼要倒圓角?為什麼地震導致有些房屋直接倒塌而有些房屋卻僅僅是結構發生變形?這些問題如果不是想當然,而是去思考其所以然,你可能會體會到知識帶給你的樂趣。有些同學認為,力學學習太難了,最主要的原因是需要太多的數學。那麼我告訴你,首先你自己要克服畏難情緒。
  • 人工智慧時代:課程教學如何以變應變
    學生需要哪些素養和能力  人工智慧時代,低階認知技能的重要性會下降,如記憶、複述、再現等初級的信息加工任務將更多由機器代替,而深層知識和高階認知的重要性會更加凸顯。在此背景下,特別要強調培養學生四個素養和五種能力。  四個素養即終身學習素養、計算思維素養、設計思維素養和交互思維素養。
  • 學好數理化,走遍天下都不怕?多省中考改革,弱化物理和化學
    「學好數理化,走遍天下都不怕」,這句話對於上世紀70、80年代的人來說,是再熟悉不過了。它不僅在中學的校園裡隨處可見,而且也成為了每一位學生心中的真諦。數理化過去很重要,現在呢?都知道它的重要性,但是物理和化學卻被所謂的綜合素質評價改革給弱化了。
  • 人工智慧對於社交媒體的重要性
    打開APP 人工智慧對於社交媒體的重要性 發表於 2016-11-25 18:10:15 (這就是為什麼網際網路上到處都是寵物貓的圖片。)全球範圍內,超過20億人在使用社交媒體,這一數量是擁有汽車的人數的兩倍。你如果經營某一品牌,特別是與消費者緊密聯繫的品牌,就不能忽略客戶的社交媒體信息。   待篩選的社交媒體內容越來越多。用戶每天每分鐘都會向Twitter上傳超過347,000條內容。Facebook上,用戶每分鐘上傳「like」信息超過400萬次。
  • 大講堂 | 人工智慧所需的數學基礎
    雷鋒網(公眾號:雷鋒網)AI研習社按:隨著大數據時代的到來在本次雷鋒網AI研習社公開課中,講者將分享轉行深度學習所需要的數學基礎以及相關熱門的CNN、RNN、GAN的數學思考。分享主題人工智慧所需的數學基礎分享嘉賓張碩璽,武漢大學數學系碩士 分享提綱1、深度學習為什麼熱門2、深度學習所需要的數學基礎及相關思想
  • 「學好數學的秘密不在課堂」
    原標題:「學好數學的秘密不在課堂」 「初中是數學學習的關鍵過渡期,這對初中數學教師的教學能力和教學方法提出了挑戰。」昨天,美國芝加哥大學數學系教授扎爾曼·尤西斯金在華東師範大學分享了他多年的教學研究成果,並接受文匯報記者採訪。
  • 數學和人工智慧的極限
    所以今天來講的,是數學和人工智慧這條邊界劃在哪,以至於我們不要試圖越過這個邊界,而是在邊界內,把事情做好。以及在未來的智能時代,我們人怎麼能夠發揮自己最大的作用。先講講人工智慧是怎麼爆棚的。在大家對於未來的預測中,估計明年打撲克牌的世界冠軍,會是計算機。
  • 李大潛院士:為什麼學數學?因為它能幫助我們認識和改造世界
    為什麼要花這麼多時間來學習數學?又為什麼一定要努力學好數學呢?如果認為這種學習只是為了執行學校與老師的規定,只是為了應付有關的考試並取得一個好的成績,只是為了混得一張文憑將來找一個高收入的工作,或者只是為了或多或少掌握一些有關的數學知識,那麼即使進了數學科學學院,也必然會對數學學習採取一個被動和應付的態度,學習的效果也必然會受到很大的影響。
  • 李大潛院士:今天我們為什麼要學數學?怎麼學好數學?
    日前,由復旦大學和人民教育出版社共同舉辦的「第十二屆『蘇步青數學教育獎』頒獎會暨中學數學教育論壇」在人民教育出版社舉行。「蘇步青數學教育獎」是國內第一個獎勵從事中學數學教育工作者的獎項,也是目前我國中學數學教育界的最高獎,在全國中學數學教育工作者中享有盛譽。
  • 人工智慧時代,還有必要學習英語嗎?
    說起學英語,相信很多人心裡是五味雜陳呀,從最開始的背單詞,學語法,聽錄音,做練習,好不容易學成了中式英語,卻突然發現時代變了,人工智慧時代都快來了,學一門外語如果只是學得一點點,而不是生活中時常用到的話,那學英語的意義到底在哪?還有必要學英語嗎?
  • 學好初二物理的重要性
    我們可以應用所學的物理知識對這些現象進行解釋,比如說為什麼天上能夠下雨,而又什麼又會下雪?冬天的時候家裡的窗戶上為什麼會有霧氣或是結冰?學習了物理我們就能夠解釋這些現象。   2、物理學和我們的生活有著密切的聯繫和廣泛的應用。比如說,我們家家都用電,那麼電怎麼來的呢?家裡有電燈,冰箱,電視等等電器,還有開關,插座,他們之間是怎麼連接的?為什麼有時候會跳閘呢?