數據科學課應該如何開展,數據競賽平臺帶來的啟示

2020-11-29 站長之家

隨著數據科學與人工智慧相關理論的快速發展,傳統行業若沒有借用數據科學方法,僅在自己的專業領域深耕,已經無法高效解決快速變化的學科研究與應用中面臨的一些新問題。在數據智能時代,如何利用人類有限的算法來處理日益增長的數據,如何幫助社會實現「數據商業化」、創造數據產生的衍生價值,已經成為眾多領域亟待解決的問題。

數據科學相關專業發展迅速,學科建設難度不可小覷

自 2016 年教育部首次批准部分本科院校開設「數據科學與大數據技術」專業以來,截止目前,已經有近 500 所高校成功獲批大數據相關專業,另外,還有 35 所高校已直接獲批「人工智慧」專業。從數據上可以看出,我國對數據科學人才培養的需求已然呈爆發式的增長。

數據科學專業的建設如火如荼,但這背後卻存在不小的隱憂。

數據科學類專業的大量開設往往伴著隨之而來的學科評估工作,學科評估不僅要考核師資隊伍與資源、科學研究水平、人才培養質量和學科聲譽,對於數據科學這類行業結合度高的新專業,還需要關注教學模式、課程體系方面的革新舉措,以及是否能將所學應用在科研和行業中,培養出符合時代需求的數據人才。所以,在數據科學相關專業大量開設以後,高校勢必面臨著一個問題:如何教好數據科學這門課?

數據科學在中國乃至世界範圍內依然是全新領域,這個結合了數學、編程、領域知識的學科,相比傳統學科,教學難度似乎大了很多,教學形式尚待摸索。而高校教師往往承擔著教學和科研雙軌結合的工作,放在學科準備和教學上的時間相對有限,那麼這個專業應該如何高質量、高效率地開展教學?

在沒有得到確切答案之前,有一點可以形成共識,那就是新學科需要新模式、新方法,傳統封閉式教學方式很可能已經跟不上新學科的要求了。數據科學是一個需要調動跨學科知識解決實際問題的專業,也就意味著選擇一套教材、採買一套軟體、搜集精品案例進行課堂教學的傳統教學方式不再能夠培養出滿足科研、生產的實戰型人才了。

也就是在這個思考的過程中,數據競賽開始出現在老師們的視野中。

將數據競賽支持平臺引入課堂,探索數據科學教育的新模式

何為數據競賽?

簡單來說,數據競賽是指在數據科學領域,以真實數據集和真實業務問題為基礎,由企業以及各類權威機構舉辦,在短時間內聚合大量優質數據科學家和愛好者參與,以高端數據算法或數據方案創新為結果導向的開放性競賽模式。

自 2014 年以來,中國市場的數據競賽每年都以倍數級增長,除部分國內頂尖高校以外,經濟、金融、生物醫療等領域的企業與科研機構也都紛紛參與其中,甚至是莊嚴謹慎的政府機構也意識到了數據競賽的力量,開始在眾多數據競賽中扮演極其重要的角色。

許多高校老師應該對「中國高校計算機大賽——大數據挑戰賽」非常熟悉,值得注意的是,中國高校計算機大賽已列入全國普通高校學科競賽排行榜,被絕大多數高校認定為是A類競賽,與保研加分直機制接掛鈎,選手在賽事中取得優異的成績不僅能為就業加持,更能讓他們申請獎學金和保研資格的過程更加順利。

讓我們以備受矚目的「 2019 中國高校計算機大賽——大數據挑戰賽」為例,這場由教育部相關單位指導、清華大學主辦的競賽,面向高校在校生開放,旨在提升高校學生對數據分析與處理的算法研究與技術應用能力,探索大數據的核心科學與技術問題,嘗試創新大數據技術,推動大數據的產學研用。剛剛結束的新一屆比賽,共有來自全球 10 餘個國家及地區, 4893 位選手, 4638 支隊伍,20000+次提交參與評審,創歷史新高。

通過賽後選手採訪,我們了解到數據競賽為學生帶來的不僅是名次上的榮譽和保研時的加分,更重要的是,這次數據競賽其實是不少同學的首次編程實踐,不同於普通的課內練習,參與數據競賽不僅要求參與者掌握一定的編程技能,還要有敏感的商業洞察力。

還有一點很重要的是,這次數據競賽的平臺將數據、雲算力和協作及時都集中在同一個在線工具上,讓他們能夠跑通一個完整的研發過程,通過K-Lab支持的數據競賽,大家能掌握數據科學實踐中最重要的團隊協作能力、編程實戰能力、計劃管理能力和成果導向思維。

這些也正是數據科學中要求大家掌握的重點,更關鍵的是,這些過程幾乎不需要主辦方花費太多精力進行監督指導,只需要提供賽題和數據,學生便可以進行自主實踐學習。

所以不妨設想一下,如果能將數據競賽的支持工具直接引入課堂呢?又或是說將授課模式變成類似數據競賽的過程?數據科學教育中的問題是不是就能迎刃而解了,這對於高校來說,將是一個有趣的問題。

這不是說說而已,國內還真有這麼一所學校拋棄了傳統廠商的封閉式教學環境,採用數據競賽形式的教學平臺來進行數據科學專業教學,這就是高校大數據挑戰賽的主辦單位——清華大學。

將數據競賽平臺引入課堂,探索全新教學方式

2018 年,清華大學軟體學院面向全校範圍內的本科生開設了「數據科學與技術」輔修專業,由於數據科學的火熱,原定 80 人的名額不但擴容到最後的 120 人,上百人的班級和亟待建設的課程體系本無疑非常棘手的問題,但清華大學軟體學院面對這些需求卻顯得十分從容。

深入到課堂我們才發現,他們所用的教學工具與其他院校不同,這正是與高校大數據挑戰賽同一套數據科學工具——和鯨科技旗下的K-Lab。前面提到過,大賽全程使用的工具也是K-Lab,作為競賽的底層平臺,可以支持了2000+人的並發使用,它開箱即用的在線環境讓學生免去裝包之類的繁瑣教學準備,而可視化界面和代碼片段功能也對各行業的數據分析十分友好。

除了這些優點之外,更令人驚喜的是,K-Lab還能夠無縫連結在線社區資源的教學工具,不僅將海量的數據資源、前沿成果實時鏈入課堂,更能直接把平臺上現成的優質數據競賽體面和練習任務作為考核資料,讓學生通過使用競賽同款工具和同款賽題來提升能力,打磨成果。

將最新的行業數據引入課堂

毋庸置疑,每一場數據競賽所提供的數據皆為出題方所提供的行業內真實且全新的數據,而評審方式和優質方案也都早已配置在平臺上,這對於數據科學新專業是很大的利好。

有了K-Lab,授課就可以不要再繼續使用幾十年前的「經典」陳舊數據,而是用上「與時俱進」的真實數據,從而能夠直接通過這一教學平臺將前沿方法和解決方案放到實際問題當中,完成真正意義上的數據科學教學

激發學生參與競賽的熱情

而且通過使用與競賽平臺相同的數據科學教學工具,會大大激發學生參與數據競賽的熱情,從而在尅外自主進行進行有效的數據實踐,發揮自身優勢和價值。

學校也能夠很輕鬆地培養出具備實戰經驗、能將所學與社會緊密關聯保持同步前進的學生。

用自動評審功能給老師減負

大家都知道高校內有一個很普遍的現象,那就是作業量大評閱周期比較長,這不僅會耗費老師大量的時間,還容易導致學生的學習興趣與效率遞減。

但是依託在線工具數據競賽卻不一樣,在以K-Lab為支撐數據競賽平臺上,每次提交都會有自動評審的功能,選手能實時查看自己的排名,從而快速彌補自己的不足,了解每次成果如何優化,這也是為什麼這麼多人會孜孜不倦地參加眾多競賽的原因之一,參與競賽其實是自我鍛鍊的過程。

考慮到這一點,K-Lab將自動評審的功能引入到課堂中,根據賽事配置好的評分規則進行實時自動評審,既能減輕教師的評審負擔,又能讓學生快速得到學習反饋,在學習興趣最濃厚的時候解決所存在的問題,可謂是一舉兩得。

據筆者有幸聯繫到的使用過的同學描述,自己是非計算機專業的學生,在上這堂輔修課之前一直認為編程比較難,但驚喜的是上課用到的K-Lab能讓他們快速上手進入能分析一些數據,成就感十足;他們還表示,通過課後練習也感受到了K-Lab自動評審功能的強大,往往交了作業一周以後他們才能得到成績,但K-Lab自動評審實現了作業的即時反饋,大大提升了學習效率。

正是由於清華大學這種時刻貫徹學以致用教學理念,勇於打破傳統教育模式的探索者,才能讓像K-Lab這種能夠真正打通教學、科研、企業場景以及嵌入各類資源的工具能夠從競賽場景走入教學場景,為我國的數據科學教育探索出了寶貴的經驗。

免責聲明:「站長之家」的傳媒資訊頁面文章、圖片、音頻、視頻等稿件均為自媒體人、第三方機構發布或轉載。如稿件涉及版權等問題,請與我們聯繫刪除或處理。稿件內容僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性,更不對您的投資構成建議。我們不鼓勵任何形式的投資行為、購買使用行為。

相關焦點

  • Filecoin太空競賽,這些數據你要搞懂!
    一度被大家「神化」的太空競賽算力排名究竟有多大參考價值,Filecoin太空競賽算力排行榜中的各種數據又是什麼意思呢? 隨著Filecoin 太空競賽進入第三周,全網有效算力達到了146PiB。(截圖時間:9月8日 16:30) Filecoin官方人員mosh此前在Slack頻道發布消息稱,太空競賽將在本周開展一系列的重要測試
  • Filecoin太空競賽,這些數據你要搞懂
    (截圖時間:9月8日16:30)  Filecoin官方人員mosh此前在Slack頻道發布消息稱,太空競賽將在本周開展一系列的重要測試此時,我們不禁要理性思考,一度被大家「神化」的太空競賽算力排名究竟有多大參考價值,Filecoin太空競賽算力排行榜中的各種數據又是什麼意思呢?  算力排名  對於很多投資者來說,首先關注的肯定是排名情況。
  • 美國小學科學教學的特色及帶來的啟示
    有問題隨時提問且不需要起立或得到允許,教師職責在於引導教會兒童如何探索。這在提高學生自主能力、培養其智力和科學素養方面給了我們一定啟示。 (四)以開放探究為中心的教學方法 1.開放探究代表著一種新的科學教育方法。
  • 上海天文臺在SKA首個科學數據競賽中獲佳績
    上海天文臺作為參賽團隊參與了該競賽,並在總評分名列首位。  SKA首個數據競賽於2018年啟動,2019年4月結束。全球共有9支團隊按時提交結果。上海天文臺於競賽啟動即組織人員進行規劃準備,展開前期測算,中期雖因數據的重新發布而需要對所有數據進行重新處理分析,但參賽團隊保持積極應對,經過半年多的努力,反覆討論完善數據分析,完成競賽。
  • 數據分析:創建統一的公有基因組數據平臺
    NIH取消不準上傳到雲端的規定是因為基因組學研究中正面臨著現實問題:如何獲取資料庫中的大量數據。這已經阻礙了科研人員的工作,尤其是當研究工作涉及到現有的數據信息時。為了充分利用雲計算技術所提供的便利,我們敦促NIH和其他科研資助機構在常用的雲平臺中免費提供基因組數據。
  • 除了Kaggle,這裡還有一些含金量高的數據科學競賽哦
    Kaggle 是很有名的數據科學競賽平臺。這個在線社區有 10 萬多註冊用戶,這些用戶有新手也有專家。但除了 Kaggle,還有一些其它值得了解和研究的數據挖掘競賽平臺。Driven DataDriven Data 舉辦數據科學競賽的目的是要建設更美好的世界,用最先進的預測模型來解決世界上最棘手的問題。
  • 大數據到底應該如何學?大數據生態圈技術組件解析
    作為學習者,我們關心的應該是大數據能夠解決什麼樣的問題,能夠應用在哪些領域,應該學習哪些內容,側重哪一方面。簡單來說,我們需要學習的就是一系列的大數據生態圈技術組件,以及貫穿整個數據分析流程的分析方法和思維,並且思路更加重要一些!只有明確了數據分析場景與流程,我們才能夠確定需要整合哪些大數據組件來解決這一問題。下面我們將一起推開這一領域的大門~2. 數據是如何採集的大數據分析的第一步就是對數據的收集和管理,我們需要先來了解一下數據是如何產生的?
  • 果洛州公安局以九條措施加速推進大數據智能應用平臺建設
    ,結合我州涉藏地區社會治理實際,採取「九條措施」,加快推進公安大數據智能化應用平臺建設。四、比武競賽選樹典型把大數據應用的比武競賽作為一項常態化工作來抓,針對熱點難點和棘手的急難險重任務,適時更新比武賽題,不斷與實戰接軌,在服務實戰中礪煉人才、培養隊伍,借力「大練兵」活動,以身邊的典型推進大數據應用場景。
  • 解讀數據挖掘與數據科學之間鮮為人知的區別
    然而,儘管人們對數據科學的工作越來越感興趣,但並不知道如何從事這個職業。因此應該了解數據科學的職業生涯,這其中包括了解不同數據流程之間的差異。一些行業網站和大學正在提供有關數據科學的學習課程。然而,對於初學者來說,他們對於如何入門以及如何選擇有效的路徑並不總是很清楚。因為數據技術領域中一些相似的領域存在顯著的差異。
  • 蛋白降解療法:首批臨床療效數據帶來什麼啟示?
    日前,羅氏(Roche)與Vividion Therapeutics公司剛剛達成一項數十億美元的研發協議,利用Vividion公司的蛋白質組學篩選平臺和小分子資料庫,開發創新蛋白降解療法。上周,專注於開發蛋白降解療法的Monte Rosa Therapeutics公司也脫穎而出,完成數額為3250萬美元的A輪融資。
  • 科學課怎樣上更科學?——三問科學課進課堂
    科學課與語文、數學一樣,從小學一年級就開設,這種重視程度引發社會廣泛關注。  新的科學課程體系有哪些變化?科學課現存短板如何補齊,怎樣更科學上好科學課?  新科學課程體系有哪些變化?  記者梳理發現,科學課進入小學課堂其實已經有16個年頭。
  • 博觀首發 | 宋博:企業如何構建數據安全治理原則
    從治理角度看,人工智慧帶來的國際治理難題是如何在保護隱私的前提下開展數據合作。以人工智慧在醫療領域為例來看,外國藥企需要通過在中國開展以數據比較為目標的實驗來對其藥物研發進行極為關鍵的修正。而國內醫療企業在引進國外的醫療人工智慧技術方面也需要解決數據隱私的管理挑戰。
  • 我校管理學院通過INFORMS年會發布2021年MSOM全球數據驅動研究競賽...
    我校管理學院通過INFORMS年會發布2021年MSOM全球數據驅動研究競賽數據信息 根據全球最大的管理科學協會(
  • 數據分析前的準備及如何為我們帶來長期價值?
    數據分析在如今的網際網路公司中很常見,但是很少有人思考分析數據前要做哪些準備,以及數據分析是如何帶來長期價值的?本文將從三個方面展開分析,對數據分析感興趣的童鞋不要錯過。
  • 誰在存儲數據,太空競賽第二階段
    太空競賽到目前為止已經進行兩周時間,整個網絡取得驚人的進展,截止到2020年10月13日,整個網絡中進行了超過250000個存儲交易,存儲的數量達到180TB,所有這些數據都是由此次太空競賽的參與者存儲的,這與網絡的建立初衷一致。
  • 數位化轉型,數據人應該關注什麼
    過去,可口可樂活在廣告裡;現在,可口可樂活在了「數位化平臺」中。 所以,不管是「主動的」,還是「被動的」,大家都在拼命的「數位化」,玩命的「標準化」。 |0x01 數據的標準化越來越重要 回到技術本身,我們看待「數位化」這件事情,其實更多的應該聚焦在「標準化」上。
  • 「網際網路+醫療」健康醫療大數據能帶來什麼?
    ,給老百姓帶來接二連三的全新就醫體驗,獲得了不少好評。 「網際網路+醫療」給人們帶來的舒適就醫體驗,正在讓大家拋棄傳統的就醫模式。   正如大家剛熟悉的移動端預約掛號繳費,新的就醫模式又接踵而至了。   「在『網際網路+醫療』建設過程中,我們前期已經做了很多基礎性的工作,打通醫院各應用系統與網際網路醫院平臺的數據交換接口等等。」楊國慶表示,伴隨著「網際網路+醫療」工作的不斷推進。如何採用先進的信息技術讓老百姓就醫更便捷?
  • ISI World Cup 2019國際大數據分析競賽 金山AI Lab團隊摘得桂冠
    本次會議開啟前,IEEE特別發起了國際大數據分析競賽(IEEE ISI World Cup 2019),來自來自中國、美國、巴基斯坦、英國、德國等 7 個國家的企業、高校共 363 支隊伍, 1001 名選手參戰,金山AI Lab團隊以大比分優勢在Mission2 比賽中奪得冠軍,應邀參加了如期舉行的國際會議。
  • 言之有裡丨寶馬iX3的推出帶來哪些新啟示?
    早在今年年初,寶馬就已經明確表示過了,短期內沒有開發純電平臺的計劃。寶馬未來推出的新能源車,都將遵循「油電共享」的戰略。這一表態在當時同樣引發過不小的爭議。尤其是在開發純電平臺被視為「政治正確」的當下。到底應不應該在當下研發純電平臺,這個話題太大,在此我不想過多討論。不過有一點可以明確,「油電共享」與「油改電」是有本質區別的。
  • 中國信通院聯合主辦的第四屆工業大數據創新競賽圓滿落幕
    (原標題:中國信通院聯合主辦的第四屆工業大數據創新競賽圓滿落幕)