隨著數據科學與人工智慧相關理論的快速發展,傳統行業若沒有借用數據科學方法,僅在自己的專業領域深耕,已經無法高效解決快速變化的學科研究與應用中面臨的一些新問題。在數據智能時代,如何利用人類有限的算法來處理日益增長的數據,如何幫助社會實現「數據商業化」、創造數據產生的衍生價值,已經成為眾多領域亟待解決的問題。
數據科學相關專業發展迅速,學科建設難度不可小覷
自 2016 年教育部首次批准部分本科院校開設「數據科學與大數據技術」專業以來,截止目前,已經有近 500 所高校成功獲批大數據相關專業,另外,還有 35 所高校已直接獲批「人工智慧」專業。從數據上可以看出,我國對數據科學人才培養的需求已然呈爆發式的增長。
數據科學專業的建設如火如荼,但這背後卻存在不小的隱憂。
數據科學類專業的大量開設往往伴著隨之而來的學科評估工作,學科評估不僅要考核師資隊伍與資源、科學研究水平、人才培養質量和學科聲譽,對於數據科學這類行業結合度高的新專業,還需要關注教學模式、課程體系方面的革新舉措,以及是否能將所學應用在科研和行業中,培養出符合時代需求的數據人才。所以,在數據科學相關專業大量開設以後,高校勢必面臨著一個問題:如何教好數據科學這門課?
數據科學在中國乃至世界範圍內依然是全新領域,這個結合了數學、編程、領域知識的學科,相比傳統學科,教學難度似乎大了很多,教學形式尚待摸索。而高校教師往往承擔著教學和科研雙軌結合的工作,放在學科準備和教學上的時間相對有限,那麼這個專業應該如何高質量、高效率地開展教學?
在沒有得到確切答案之前,有一點可以形成共識,那就是新學科需要新模式、新方法,傳統封閉式教學方式很可能已經跟不上新學科的要求了。數據科學是一個需要調動跨學科知識解決實際問題的專業,也就意味著選擇一套教材、採買一套軟體、搜集精品案例進行課堂教學的傳統教學方式不再能夠培養出滿足科研、生產的實戰型人才了。
也就是在這個思考的過程中,數據競賽開始出現在老師們的視野中。
將數據競賽支持平臺引入課堂,探索數據科學教育的新模式
何為數據競賽?
簡單來說,數據競賽是指在數據科學領域,以真實數據集和真實業務問題為基礎,由企業以及各類權威機構舉辦,在短時間內聚合大量優質數據科學家和愛好者參與,以高端數據算法或數據方案創新為結果導向的開放性競賽模式。
自 2014 年以來,中國市場的數據競賽每年都以倍數級增長,除部分國內頂尖高校以外,經濟、金融、生物醫療等領域的企業與科研機構也都紛紛參與其中,甚至是莊嚴謹慎的政府機構也意識到了數據競賽的力量,開始在眾多數據競賽中扮演極其重要的角色。
許多高校老師應該對「中國高校計算機大賽——大數據挑戰賽」非常熟悉,值得注意的是,中國高校計算機大賽已列入全國普通高校學科競賽排行榜,被絕大多數高校認定為是A類競賽,與保研加分直機制接掛鈎,選手在賽事中取得優異的成績不僅能為就業加持,更能讓他們申請獎學金和保研資格的過程更加順利。
讓我們以備受矚目的「 2019 中國高校計算機大賽——大數據挑戰賽」為例,這場由教育部相關單位指導、清華大學主辦的競賽,面向高校在校生開放,旨在提升高校學生對數據分析與處理的算法研究與技術應用能力,探索大數據的核心科學與技術問題,嘗試創新大數據技術,推動大數據的產學研用。剛剛結束的新一屆比賽,共有來自全球 10 餘個國家及地區, 4893 位選手, 4638 支隊伍,20000+次提交參與評審,創歷史新高。
通過賽後選手採訪,我們了解到數據競賽為學生帶來的不僅是名次上的榮譽和保研時的加分,更重要的是,這次數據競賽其實是不少同學的首次編程實踐,不同於普通的課內練習,參與數據競賽不僅要求參與者掌握一定的編程技能,還要有敏感的商業洞察力。
還有一點很重要的是,這次數據競賽的平臺將數據、雲算力和協作及時都集中在同一個在線工具上,讓他們能夠跑通一個完整的研發過程,通過K-Lab支持的數據競賽,大家能掌握數據科學實踐中最重要的團隊協作能力、編程實戰能力、計劃管理能力和成果導向思維。
這些也正是數據科學中要求大家掌握的重點,更關鍵的是,這些過程幾乎不需要主辦方花費太多精力進行監督指導,只需要提供賽題和數據,學生便可以進行自主實踐學習。
所以不妨設想一下,如果能將數據競賽的支持工具直接引入課堂呢?又或是說將授課模式變成類似數據競賽的過程?數據科學教育中的問題是不是就能迎刃而解了,這對於高校來說,將是一個有趣的問題。
這不是說說而已,國內還真有這麼一所學校拋棄了傳統廠商的封閉式教學環境,採用數據競賽形式的教學平臺來進行數據科學專業教學,這就是高校大數據挑戰賽的主辦單位——清華大學。
將數據競賽平臺引入課堂,探索全新教學方式
2018 年,清華大學軟體學院面向全校範圍內的本科生開設了「數據科學與技術」輔修專業,由於數據科學的火熱,原定 80 人的名額不但擴容到最後的 120 人,上百人的班級和亟待建設的課程體系本無疑非常棘手的問題,但清華大學軟體學院面對這些需求卻顯得十分從容。
深入到課堂我們才發現,他們所用的教學工具與其他院校不同,這正是與高校大數據挑戰賽同一套數據科學工具——和鯨科技旗下的K-Lab。前面提到過,大賽全程使用的工具也是K-Lab,作為競賽的底層平臺,可以支持了2000+人的並發使用,它開箱即用的在線環境讓學生免去裝包之類的繁瑣教學準備,而可視化界面和代碼片段功能也對各行業的數據分析十分友好。
除了這些優點之外,更令人驚喜的是,K-Lab還能夠無縫連結在線社區資源的教學工具,不僅將海量的數據資源、前沿成果實時鏈入課堂,更能直接把平臺上現成的優質數據競賽體面和練習任務作為考核資料,讓學生通過使用競賽同款工具和同款賽題來提升能力,打磨成果。
將最新的行業數據引入課堂
毋庸置疑,每一場數據競賽所提供的數據皆為出題方所提供的行業內真實且全新的數據,而評審方式和優質方案也都早已配置在平臺上,這對於數據科學新專業是很大的利好。
有了K-Lab,授課就可以不要再繼續使用幾十年前的「經典」陳舊數據,而是用上「與時俱進」的真實數據,從而能夠直接通過這一教學平臺將前沿方法和解決方案放到實際問題當中,完成真正意義上的數據科學教學。
激發學生參與競賽的熱情
而且通過使用與競賽平臺相同的數據科學教學工具,會大大激發學生參與數據競賽的熱情,從而在尅外自主進行進行有效的數據實踐,發揮自身優勢和價值。
學校也能夠很輕鬆地培養出具備實戰經驗、能將所學與社會緊密關聯保持同步前進的學生。
用自動評審功能給老師減負
大家都知道高校內有一個很普遍的現象,那就是作業量大評閱周期比較長,這不僅會耗費老師大量的時間,還容易導致學生的學習興趣與效率遞減。
但是依託在線工具數據競賽卻不一樣,在以K-Lab為支撐數據競賽平臺上,每次提交都會有自動評審的功能,選手能實時查看自己的排名,從而快速彌補自己的不足,了解每次成果如何優化,這也是為什麼這麼多人會孜孜不倦地參加眾多競賽的原因之一,參與競賽其實是自我鍛鍊的過程。
考慮到這一點,K-Lab將自動評審的功能引入到課堂中,根據賽事配置好的評分規則進行實時自動評審,既能減輕教師的評審負擔,又能讓學生快速得到學習反饋,在學習興趣最濃厚的時候解決所存在的問題,可謂是一舉兩得。
據筆者有幸聯繫到的使用過的同學描述,自己是非計算機專業的學生,在上這堂輔修課之前一直認為編程比較難,但驚喜的是上課用到的K-Lab能讓他們快速上手進入能分析一些數據,成就感十足;他們還表示,通過課後練習也感受到了K-Lab自動評審功能的強大,往往交了作業一周以後他們才能得到成績,但K-Lab自動評審實現了作業的即時反饋,大大提升了學習效率。
正是由於清華大學這種時刻貫徹學以致用教學理念,勇於打破傳統教育模式的探索者,才能讓像K-Lab這種能夠真正打通教學、科研、企業場景以及嵌入各類資源的工具能夠從競賽場景走入教學場景,為我國的數據科學教育探索出了寶貴的經驗。