原標題:中國「AI人才」快速成長 「乘風破浪的學習」追逐科技夢想
7月以來,A股走勢迷惑,月初上證指數突破3000點大關,僅九個交易日最高漲至3458.79點,漲超15%;未到中旬,大盤連續四個交易日下跌;再到本周,上證指數再次上漲3.11%。接下來走勢又將如何?
答案難測,眾說紛紜。股市分析信息冗繁複雜,令人有種「進了考場忽覺書到用時方恨少」的無力感。對比早在十四年前就在分析報告中指出「2020年的A股市場將出現繁榮階段」的券商分析師,眾「韭菜」的差距到底在哪裡呢?這就不得不提到「對於信息與環境的感知(探索)」和「對環境信息的映射與反饋(利用)」能力。而這一點,機器在未來一定比人類能做的更多。
「不限於對錯之分,只追尋利害之度」
今年年初開始入局股市的人都是勇士,事實證明,懂AI技術的人是「開了掛」的真勇士。GitHub上一名來自哈爾濱工業大學的在讀博士,年初時作為股市一顆新生「白菜兼韭菜」自述忽然產生了抄底的大膽想法,一番操作後結果果然慘不忍睹。然而那時那刻,他痛定思痛,拿出了AI技術從業者新思路:如果用深度強化學習來炒股,順便驗證下收益的話怎麼樣?抱著在現實中用AI技術「上下而求索」的精神,他花了20天終於讓機器自己炒股賺了400塊。不要小看這400,優化優化再花點時間,誰知道未來會不會是4個億呢!
那麼問題來了,什麼是深度強化學習?近兩年,隨著計算機視覺(CV)與自然語言處理(NLP)在工程與產業中不斷落地,以及深度學習「三巨頭」共同獲得2018年度圖靈獎,深度學習的概念首先開始被更多人了解認知,而強化學習與深度學習同屬機器學習,亦稱「增強學習」並與深度學習存在著交叉領域。其中,強化學習強調的是在一系列的情景之下選擇最佳決策,即「通過多步恰當的決策來逼近一個最優的目標」,因此,它是一種「序列多步決策」問題。
(圖:百度飛槳《強化學習7日打卡營-世界冠軍帶你從零實踐》公開課內容)
定義看不懂不重要,只要看懂「決策」——這在諸多領域具有重要價值的二字即可。6月,百度飛槳推出《強化學習7日打卡營-世界冠軍帶你從零實踐》入門強化學習的公開課,一經推出,課程的直播人氣就飆升至B站全站學習類直播同期的Top5,課程用到的強化學習框架PARL的GitHub帳戶Star快速增長一倍以上,成為耀眼的千星項目
;PARL隨即登上GitHub全球增長趨勢榜;課程更是吸引了來自美國、新加坡、德國、日本等8個海外國家華人開發者,以及賓夕法尼亞大學、佛羅裡達大學、加州大學伯克利分校、南安普頓大學、早稻田等全球頂級名校學生,甚至還有不少跨學科的初學者。如此可見,對於「決策」能力的好奇與追求,不分專業領域、地域,甚至是年齡。
(圖:百度飛槳推出入門強化學習公開課《強化學習7日打卡營-世界冠軍帶你從零實踐》)
「好學生是鼓勵出來的」
「這次參與百度《強化學習7日打卡營》的強化學習,除了帶來『術』的增長更有思維的啟發。」58歲已退休的人才管理專家及企業教練郭崇華先生憑藉多年的自主學習熱情與興趣在結課後指出:「強化學習這門學科充滿魅力,它有著對人類社會映射的哲思。比如其中的『智能體』就是人類自己,我們無時無刻不在思考著自己與周邊環境、與世界的關係並作出反饋。我思故我在,這是人生在『道』層面上的意義。」從課程中收穫到意想不到的價值令他歡欣鼓舞,希望繼續在這個方向的堅持。「下一步我想把國外一些強化學習的好書籍翻譯成中文。」郭崇華先生如是說。
前浪在學習AI中思考著人生的「道與術」,而後浪作為AI時代原住民,似乎隨便翻騰一下都有大把的機會去澎湃未來。「從興趣出發,每一次通過自己獲得的小成功和進步都會讓我收穫巨大鼓勵。」參加過百度飛槳PaddleHub競賽,從高中就自學無人機的「後浪」鄭浩旻今年剛21歲,目前還在寧波大學讀大三。「現在就要開始計劃未來的路應該怎麼走了,自學AI方面的技能做出來一些小東西的那種自豪感無法言說,而且它本身也是超具競爭力的吃飯本事。」鄭浩旻快速喜歡上了人工智慧這個「能有效解決工程做出小東西」的好工具。
有收穫、高價值,總能激發繼續學習的強大動力,而強化學習在「自我智能的不斷實現上」所遵循的邏輯與人在學習方面的哲理一脈相承。其設計靈感源於心理學中的行為主義理論:有機體如何在環境給予的獎勵或懲罰刺激下,逐步形成對刺激的預期,從而產生能獲得最大利益的習慣性行為。因此,強化學習的核心便是「讓智能體(agent)在環境(environment)中學習,根據環境的狀態(state)執行動作(action)並根據環境的反饋獎勵(reward)來指導更好的動作」,畢竟好學生是被鼓勵(reward)出來的!
(圖:強化學習的「學習之道」)
在中國教育界的人工智慧專業尚在摸索道阻且長時,更多學習途徑與資源都如《強化學習7日打卡營》一樣,學與不學,資料就在那裡,只多不少。
「學而不思則罔」
《強化學習7日打卡營-世界冠軍帶你從零實踐》五次直播課程達到9.1萬B站人氣,峰值2.2萬,成為同期B站全站學習類直播人氣Top5。主講師科科是百度飛槳強化學習PARL團隊核心成員,所在團隊曾兩度奪得NeurIPS強化學習賽事世界冠軍以及百度最高獎。如今她「破圈」成為B站學習類網紅UP主。
「這門課是針對零基礎同學來設置的。所以我們花了很多心思讓整體聽起來不會過於理論,以免最初就消減了大家的興趣,同時也不能過於脫離理論,讓人學完只知其然而不知其所以然。」科科老師對公開課受到如此歡迎也深感驚喜,「最開始我們想有幾百人報名就很好,而第一天的課程結束後就有近900人第一時間提交了課後作業,最後報名量是預期的10倍,太意外了。」可見,國內對強化學習感興趣的人絕對大有人在,但入門和路徑似乎是第一道攔路虎,針對這個問題,郭崇華先生回顧了多年自學經歷,給出一份參考。
他分享到:「總結我的學習路徑可以分三個階段。第一個階段針對『不確定性』學習方法論,我們這一代人當時接受的教育在這部分可能比較薄弱,我選擇從概率論切入,所以去學了斯坦福科勒教授講的《概率圖模型PGM》、臺大葉柄成老師《機率》公開課,以及賓夕法尼亞大學的《概率論》、麻省理工學院非常經典的《概率論——不確定性的科學》,哈佛大學《數據科學之概率論》;第二階段是統計學與分析學,比如史丹福大學的《統計學習基礎》,哈佛大學《數據分析之統計推斷》,MIT的《統計學基礎》,約翰霍普金斯大學與賓大的《數據科學建模與推理》等課程;最後第三階段就是開始接觸機器學習領域的內容。當時AlphaGo出來的時候我就對強化學習產生了興趣,百度推出的這個強化學習入門課程在我上過的這麼多課程裡都是數一數二的,學習體驗特別棒,收穫和啟發很大,讓我對強化學習更感興趣了。」
無論是持續處於學習狀態開拓未知的郭崇華,還是帶著興趣奔向未來前途的鄭浩旻,都成為中國「AI人才」快速成長向前的一個縮影。相關報告顯示,當前中國人工智慧人才缺口已超過500萬人,主要體現在高層次領軍人才、創新團隊和跨學科創新平臺不足,基礎理論、原創算法等方面突破較少,複合型人才培養導向性不強等。不可否認的是,我國高校人工智慧培育起步較晚,然而近年來我國人工智慧學科和專業正在加快推進。
2020年3月,教育部再次審批通過180所高校開設人工智慧專業。新增數據科學與大數據技術專業的學校也增加到 100 多所;智能製造、機器人工程、智能科學與技術等專業也都有數十所學校通過審批。快速前進的過程中,百度作為國內人工智慧「頭雁」企業也積極地成為「教育夥伴」。2020年5月20日「WAVE SUMMIT 2020」深度學習開發者峰會上,百度相關負責人介紹,飛槳聯合教育部新工科產學研聯盟,開設高校深度學習師資培訓班,培養了420多家高校千餘名AI專業教師,支持200多家高校開設了人工智慧課程;算法賽、創意賽、產業賽三大類型賽事全年無休,以賽促學,近一年累計舉辦超65場。緊接著6月,百度宣布未來5年將持續投入對AI人才的培養,特別是AI應用型人才的培養,預計到2025年培養AI人才500萬,為中國新基建與智能經濟建設提供人才保障。
功成不必在我,功成必定有我。中國的新基建與未來AI建設,唯有快速培養出一大批懷揣技術信仰,具備專業技術並勇於嘗試的高層次AI人才,才能抓住新一輪科技革命和產業變革的機遇!
百度搜索AI Studio進入官網訪問《強化學習7日打卡營-世界冠軍帶你從零實踐》公開課及更多AI課程。
(本文轉自 北國網)
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。