CIO時代APP微講座:廈門大學林子雨深入探討關於高校大數據教學若干...

2021-01-11 CIO時代網

  2017年1月10日,廈門大學信息科學與技術學院助理教授林子雨在CIO時代APP微講座欄目作了題為《關於高校大數據教學若干關鍵問題的探討》的主題分享,從大數據實驗平臺的搭建方法、雲計算與大數據課程知識交叉問題解決方法以及大數據教學資源建設三個方面,對高校大數據教學關鍵問題進行了探討。

  一、如何搭建大數據實驗平臺

  在高校大數據教學過程中,實踐是很重要的環節,因此,很多高校在開設大數據課程時,不僅要選擇好的教材,同時也要選擇好的大數據實驗平臺。總體而言,當前國內有以下幾種大數據實驗平臺方案: 

 (一)建設統一的大數據實驗機房

  目前,在國內有兩種典型的大數據實驗機房建設方案: 

 第一,多臺終端機採用雲桌面方式連接到中心伺服器。

這種模式在一部分高校已得到廣泛使用。通常而言,中心伺服器採用高密度伺服器,採用虛擬化技術得到很多虛擬化資源,所有的終端機都可以連接到中心伺服器,共享這些虛擬化資源,因此,終端機僅起到雲桌面的作用,數據處理運行都是在中心伺服器上進行的,因此,這種模式對終端機的配置要求較低。這種模式在實際的高校部署中,又會有兩種不同的方案:第一種方案是在學校本地機房放置中心伺服器,各個終端機直接連接到本地伺服器。另外一種方案是中心伺服器不是放在高校實驗室的內部機房中,而是放置在阿里雲等公有雲平臺上,或者放在大數據實驗平臺供應商自己的數據中心裡,高校可以通過瀏覽器訪問雲端的大數據實驗環境。 

 第二,用多臺物理機器構建分布式環境。

在這種模式中,每臺物理機器都構成一個分布式計算節點,多個節點構成分布式的集群環境。在這種模式下,高校的通常做法是將學生進行分組,比如5個學生一組,為5個學生分配5臺物理機器,由學生完成大數據集群環境搭建,或者,機房管理員已經為這5臺機器統一安裝了大數據集群環境,學生可以直接在這5臺物理機上進行相關大數據實驗。  

(二)單機構建實驗環境

  既然已經有了統一的大數據實驗機房,為什麼還需要單機方式呢?主要有三個方面的原因:

  (1)有些學校沒有建設統一的大數據實驗機房,需要教師和學生自己在電腦上安裝大數據實驗平臺;

  (2)學校有統一的機房,但是,上機時間有限,學生需要在宿舍或者實驗室,進行大量的課後上機實踐,需要在自己電腦上安裝大數據實驗平臺,隨時實踐

  (3)學校的統一機房本身就採用每臺機器獨立安裝的方式。很多機房都具有統一的管理平臺,可以把大數據實驗平臺製作成鏡像,然後自動快速把鏡像部署到機房的每臺電腦上。

  如果採用這種單機構建模式,通常對整個實驗室內部單機配置要求較高。一般而言,學生或老師的機器大多數為Windows系統,單機安裝方式的具體方法是,在Windows系統基礎上安裝虛擬機軟體,比如VMWare或者VirtualBox,在虛擬機軟體上安裝Linux作業系統,再在Linux作業系統上安裝Hadoop等大數據相關軟體。這種架構對底層的硬體配置要求是比較高的,因為要同時運行Windows系統和Linux系統,此時對底層資源的消耗比較大,尤其是對內存要求較高。一般而言,如果採用虛擬機方式(不是雙作業系統方式),則單機方式構建大數據實驗平臺時,單機配置至少需要8GB的內存,否則系統運行會很緩慢。單機環境如何快速部署到其他機器中呢?老師首先在自己的電腦上完成大數據實驗環境的構建,再將其導出做成「鏡像」,存放到雲盤,供學生下載,學生在自己本地電腦的虛擬機軟體中直接導入鏡像,就可以生成大數據實驗環境,直接使用,避免了繁瑣的大數據實驗環境搭建過程。  

(三)實驗室多機構建分布式環境

  在實驗室內部,完成一些相關科研數據的處理、分析,或學生進行一些大數據教學案例分析,學生或老師僅用自己的電腦構建虛擬機方式是無法高效處理分布式大數據實驗的,因此,需要利用實驗室內部三到五臺機器搭建起真正的物理分布環境,使龐大的數據進行分布式物理計算,這也是學生或老師採用的多機分布式物理環境。 

 二、如何解決雲計算與大數據課程的知識交叉

  當前,大數據、雲計算這兩門課程很多高校都在開設,其中可能會遇到一些尷尬問題,如雲計算和大數據兩門課程知識點重合度高,沒有合理地安排內容,尤其是Hadoop等大數據只是在兩門課程中可能均有介紹,使得兩門課程在大數據知識方面高度重合,於是兩門課程老師要花費大量時間多次講解同一項技術。導致學生要重複學習同一種知識,也導致了老師相互之間的尷尬等問題。出現這個問題的原因是教材選擇出現了問題,目前遇到問題的雲計算課程在選擇教材時,雲計算教材中包含了大量的大數據知識,包括Hadoop生態系統的各個組件(HDFS、HBase、MapReduce、Pig、Hive、Zookeeper等),都有詳細介紹。而老師上課通常都是圍繞教材講課的,教材寫了什麼內容,基本上就要講什麼內容。雲計算教材中包含了大量關於Hadoop等大數據知識,任課教師就只能按照教材講大量屬於大數據的內容。那麼,為什麼會導致這一現象的出現呢?這就要從雲計算和大數據的淵源說起。 

 (一)雲計算和大數據的淵源

  雲計算技術誕生於2006年,雲計算最初主要包含了兩類含義:一類是以谷歌的分布式文件系統GFS和分布式並行編程模型MapReduce為代表的大規模分布式並行計算技術;另一類是以亞馬遜的虛擬機和對象存儲為代表的「按需租用」的商業模式,也就是說,通過網絡以服務的方式為用戶提供非常廉價的IT資源這樣一種商業模式,就像我們今天的百度雲盤、阿里雲等,都屬於這種商業模式。所以,較早期的一些雲計算教材,就會包含上述兩類內容,因此,會包含大量介紹Hadoop等大數據技術的知識。但是,到了2009年2010年附近的時候,隨著大數據概念的提出,雲計算中的分布式計算技術開始更多地被列入大數據技術,所以,現在人們提到雲計算時,更多指的是底層基礎IT資源的整合優化以及以服務的方式提供IT資源的商業模式(如IaaS、PaaS、SaaS),而很少會去談及Hadoop等已經被單列為大數據的技術。

  正是因為上述原因,在2010年附近出版的一些雲計算教材,通常都會包含虛擬化、數據中心、分布式存儲GFS和分布式處理MapReduce等內容,這類教材我們稱為「雲計算大數據複合型教材」,也就是說,這類複合型教材,雖然教材名稱是「雲計算」,但是,包含了大量講解Hadoop等大數據知識的章節,而不是簡略介紹Hadoop。因為,2010年之前,大數據和雲計算的技術都是混在一起的,Hadoop等大數據技術,之前都叫雲計算,那時還不叫大數據。

  2010年到2014年之間,雲計算已經大規模普及,但是,大數據還沒有大規模普及,因此,很多高校都沒有開設大數據課程,都只開設了雲計算課程,這樣,在10年到14年之間,使用複合型雲計算教材上課,當然是不會遇到問題的。但是,到了2015年附近,越來越多高校開始開設大數據課程,大數據課程講解的是Hadoop等大數據技術。這個時候,對於那些選用複合型雲計算教材的高校而言,問題馬上暴露出來,這些高校突然發現,由於前期選擇了複合型雲計算教材,導致大數據課程和雲計算兩門課,內容重合度很高,兩門課程老師相互之間也很尷尬,到底如何協調好彼此的上課內容,顯得很棘手。  

(二)如何協調雲計算和大數據兩門課程知識點

  如何解決這個兩門課程知識點過高重合的問題呢?較好的方法是,在現在的雲計算課程中,不能繼續使用複合型雲計算教材(裡面包含過多屬於大數據技術的內容),也就是說,到了2015年以後,如果一個高校同時開設雲計算和大數據課程,在雲計算教材的選擇方面,最好把複合型雲計算教材更換成「單一型雲計算教材」。所謂的單一型雲計算教材是指,雲計算教材中,不能把Hadoop等屬於大數據課程的內容作為核心內容,只要用一個章節簡單概要介紹Hadoop等大數據技術即可,不能用好幾個章節進行大量介紹。也就是說,在「單一型雲計算教材」中,Hadoop等大數據技術只是教材的「次要內容」,只是為了考慮到雲計算和大數據的緊密關係和歷史淵源,才加以介紹,在實際授課時,用2個課時做簡單講解即可。採用「單一型雲計算教材」以後,就徹底解決了雲計算和大數據課程知識點高度重合的問題,雲計算課程只會有2個課時的大數據技術簡單介紹,詳細的大數據技術,都需要學生在大數據課程上通過32個學時來學習。

  採用「單一型雲計算教材」以後,雲計算和大數據兩門課程的知識重點就有了明顯的區分,不會重合:  

(1)雲計算的教學重點:

雲計算概念、雲計算體系架構、數據中心、虛擬化技術(平臺虛擬化、資源虛擬化、虛擬機的動態遷移、雲作業系統)、SOA架構及開發技術、雲數據中心設計與測試、雲數據中心維護與管理、雲安全架構、桌面雲、PaaS應用開發平臺、開源的雲計算管理平臺Openstack、Docker容器、大數據存儲與管理(最多2個學時,不需要實驗,只是知識介紹)。 

 (2)大數據的教學重點:

系統論述大數據的基本概念、大數據處理架構Hadoop、分布式文件系統HDFS、分布式資料庫HBase、NoSQL資料庫、雲資料庫、分布式並行編程模型MapReduce、大數據處理架構Spark、流計算、圖計算、數據可視化以及大數據在網際網路、生物醫學和物流等各個領域的應用。 

 三、如何建設優質的大數據教學資源

  優質的大數據教學資源,直接影響到大數據課程的順利開設和大數據教學水平的發展。由於當前大數據教學正處於推廣期,大數據教學資源還比較稀缺。同時,大數據知識體系非常龐雜,包含了數據生命周期內的各種技術,而且大數據知識更新換代非常快,類似Hadoop等大數據技術,剛興起幾年,又有Spark等新興技術的崛起,這進一步加劇了教師開課的難度。

  為了緩解高校大數據教學資源稀缺的現狀,全國高校教育界同仁都在不斷努力,建設資源。全國高校大數據教育聯盟多次組織召開大數據教學研討會,組織相關高校教師共同開發教學資源。

  (一)建立高校大數據課程公共服務體系的重要性

  建立高校大數據課程公共服務體系可以解決以下幾方面的問題:

  提供豐富的教學資源

  降低大數據課程開課門檻

  提升學生學習效果

  加快高校大數據課程建設進程

  不斷提升高校大數據教學水平

  (二)案例

  廈門大學資料庫實驗室致力於打造中國高校大數據課程公共服務平臺,建設了目前為止國內高校最完備的大數據課程公共服務體系,已經成為全國高校大數據教學知名品牌。平臺以開放共享方式提供免費教學資源,緩解大數據教育資源稀缺的問題,降低大數據的開課門檻。目前,平臺建設了11個1工程,包括1本教材、1個教師服務站、1個學生服務站、1個公益項目、1堂巡講公開課、1個示範班級、1門在線課程、1個交流群、1個保障團隊、1個培訓基地、1個實驗平臺。訪問廈門大學資料庫實驗室網站,即可免費訪問平臺上的所有教學資源。

  平臺向全國高校免費提供開設大數據課程所需七大黃金資源:

  1.《大數據技術原理與應用》教材

  2.大數據軟體安裝和編程實踐指南

  3.教師備課指南

  4.授課視頻

  5.實驗指南

  6.大數據課程實驗案例《網站用戶購物行為分析》

  7.Spark入門教程

  隨著大數據的全面普及,高校大數據專業建設也會加快推進,優秀大數據人才的培養和優質教學資源的建設,離不開全國高校教育界同仁、以及社會上的教育服務機構的共同努力。最後,祝願我國高校大數據教學事業不斷邁上新的臺階!

第三十屆CIO班招生 法國布雷斯特商學院碩士班招生 北達軟EXIN網絡空間與IT安全基礎認證培訓 北達軟EXIN DevOps Professional認證培訓

責編:林子雨

相關焦點

  • CIO時代APP2020年2月微講座精華
    聚焦於新技術、新商業、新管理內容,微講座了匯集了信息化 數位化領域的各方面專家。登錄CIO時代APP「分享」頻道,隨時可以收聽往期的這些微講座。關鍵詞: 微講座       CIO時代APP幾乎每天一個免費的微講座。聚焦於新技術、新商業、新管理內容,微講座了匯集了信息化/數位化領域的各方面專家。
  • 大數據:驅動高校本科教學督導模式轉型的槓桿
    教學督導從「小數據」走向「大數據」高校教學督導工作複雜,小數據「個體化、分散化」的特徵難以全面真實地反映出整體特徵,而大數據的「海量性、相關性」的特徵則能夠為理智的督導提供更充分的信息。因此,我國高校教學督導工作現代化過程中呈現出從形式單一、內容貧乏的「小數據」(如「聽評課打分表」)走向形式多樣、內容豐富的大數據評價的大趨勢。大數據驅動:聯結本科教學與督導的「節點」大數據在分析解決問題時注重運用相關關係部分代替因果關係,該做法能夠強化對問題「正是如此」[11]的解釋,與高校教學督導所追求的目標高度契合。
  • 西安電子科技大學舉辦2020全國高校信息與通信類專業教學論壇
    由西安電子科技大學通信工程學院主辦的全國高校信息與通信類專業教學論壇於12月4日至12月6日在西安成功召開。該論壇以「聚焦『新工科』卓越人才精準培養」為主題,包括清華大學、電子科技大學、北京航空航天大學、北京郵電大學、北京交通大學、上海交通大學、東南大學、南京大學等全國五十餘所高校的教師代表和相關企業的企業代表共聚一堂,共同探討信息與通信類專業建設與人才培養。
  • 關於印發《關於促進我市高校畢業生創業就業的若干措施》的通知
    關於印發《關於促進我市高校畢業生創業就業的若干措施》的通知
  • 福建省教科研管理幹部培訓班在廈門舉行
    培訓班由福建省教育廳和廈門大學聯合舉辦,福建省教育科學規劃領導小組辦公室、福建省教育科學研究所和廈門大學教育研究院承辦。省教育廳副廳長李迅出席會議並發表講話。為及時把握黨的十九屆五中全會精神,深入推進落實《深化新時代教育評價改革總體方案》《教育部關於加強新時代教育科學研究工作的意見》《教育部關於加強和改進新時代基礎教育教研工作的意見》以及全國教育科研管理幹部培訓班精神,切實增強教科研工作者的使命擔當,發揮教科研對教育改革發展的支撐、驅動和引領作用,我省舉辦了首屆全省教科研管理幹部培訓班。
  • 高校數據科學與大數據技術專業建設全景報告
    2020年3月,138所高校獲批第五批「數據科學與大數據技術」專業,180 所高校獲批新增人工智慧本科專業。經過前幾年密集的申報、備案與審批,開設「數據科學與大數據技術」專業的高校已達619所,開設「人工智慧」專業的高校達215所。再加上「大數據管理與應用專業」、「大數據技術與應用專業」,中國在大數據及人工智慧相關領域的高等教育呈現出大爆發態勢的同時,版圖已經接近確定。
  • 這些高校已發布通知|高校|暨南大學|福州大學|廈門...
    ▎暨南大學暨南大學發布返校通知,其中提到「非畢業班學生(博士研究生除外)繼續線上教學,本學期原則上不安排返校」。如果有特殊情況需要返校,必須提交申請,由學校另行決定。▎湘潭大學湘潭大學發布返校通知,決定所有非畢業年級本科學生本學期不返校,繼續按教學計劃開展線上教學。非畢業年級的研究生在由本人提出申請,導師批准並報研究生院備案後,同樣可以不返校。
  • 2020中國智慧教育高峰論壇在成都信息工程大學成功舉辦!
    他簡要介紹了中心在智慧教育建設領域所開展的工作和現階段的成效,希望通過此次論壇打造更多更好的合作交流平臺,共同探討智慧教育創新,提高教育質量,促進教育公平,為加快教育現代化、建設教育強國做出積極貢獻。為發揮互補優勢,推動產教研學合一,學校與CIO時代學院決定聯合成立成都信息工程大學產業網際網路研究院。
  • 雲南大學馬院參加全國高校思政課骨幹教師培訓
    未來網高校頻道1月3日訊(記者 楊子健 通訊員 王盡遙)雲南大學馬克思主義學院組織雲南省高校思政課「手拉手」第一組共建單位赴北京師範大學參加「2019年第三期全國高校思想政治理論課骨幹教師教學能力提升研修班」,雲南省10餘所高校的61位思政理論課骨幹教師參加了培訓研修。
  • 西南財經大學「學訓評」聯動 確保線上線下教學同質等效
    西南財經大學認真學習貫徹習近平總書記關於統籌推進疫情防控和經濟社會發展工作的系列重要講話和指示批示精神,深入落實教育部黨組和四川省委有關工作要求,把統籌抓好疫情防控和教育教學工作作為重要任務,從「學生的學、教師的教、教學的質」出發,力爭線上線下同質等效,確保教育教學科學有序、平穩推進。  強化精細化學業指導。
  • 廈門雙十中學打造「學術型」高中 育新時代英才
    個性化通識教育學生在「奇思妙想」中仰望星空在前不久的雙十大講壇上,南京大學教授黃永鋒做了「我們生活的宇宙」主題講座。500餘名高二年級學生聆聽講座。講座中,黃永鋒用和藹親切的口吻,將廣袤神秘的宇宙以數據化、科學化的姿態展現在學生面前。
  • 踐行兩大精神 攜手開創未來--黑龍江佳木斯大學「建功立業新時代...
    11月13日至15日,黑龍江佳木斯大學「建功立業新時代、奉獻龍江新發展」第二期優秀人才研修班在全國高校思想政治理論課教師研修基地(大慶師範學院)舉行,來自學校各教學單位和附屬醫院的33名優秀人才參加了本次研修。研修內容包括專題講座、現場教學、重溫入黨誓詞、學員研討交流等多個方面。
  • 鄭財英語教師國際研修班開啟「雲端」講座
    英語教師齊聚「雲端」參加國際研修講座 Jenny Yao博士從高校教師以及高校職能兩方面切入,首先以現實中「teacher researcher
  • 浙江大學以一流教育教學造就時代新人
    「十三五」期間,浙江大學深入貫徹習近平總書記關於教育的重要論述精神和對浙江大學的重要指示精神,以培養創新人才為核心使命,以開環回應時代新人的培養要求。新時代思政教育體系正日益完善:11個思政示範基地、20個思政特色平臺、36個黨建與思政現場教學基地、17個綜合素質訓練平臺、50個示範性研學空間;全面實施「專家大報告、教師重點專題講授、學生研究性學習、現場教學」四位一體的思政教學模式;梯隊化推進輔導員隊伍專業化職業化建設,有效發揮德育導師和導學團隊作用,落實校領導、高層次人才和骨幹教師擔任「新生之友」並實現新生全覆蓋
  • 廈門大學
    廈門大學新聞傳播學院 2020年全國優秀大學生新聞傳播學暑期夏令營報名指南 廈門大學新聞傳播學院  2020年全國優秀大學生新聞傳播學暑期夏令營報名指南廈門大學新聞傳播學院擬舉辦
  • 廈門最早的高校,不是廈門大學,綠色花園景色迷人!
    到廈門旅遊,很多人都會選擇到廈門大學觀光,這座美麗的大學並不是廈門市最早的高校。廈門最早的高校是哪一座呢?沒錯,它就是位於集美區的集美大學。說起集美大學,不得不提愛國華僑陳嘉庚,集美大學和廈門大學之所以能夠誕生,完全因為他。如果沒有陳嘉庚的奔走、投資,廈門的教育事業絕對不會如現在這般發達。廈門大學是著名的旅遊景點,集美大學也是不錯的觀光點,不過相對比廈門大學,到這裡來觀光的遊客明顯要少很多,這座高校是鬧市區之外的「桃源」。
  • 教育部印發《關於正確認識和規範使用高校人才稱號的若干意見》
    教育部印發《關於正確認識和規範使用高校人才稱號的若干意見》扭轉高校人才稱號「唯帽子」傾向為深化人才發展體制機制改革,激發人才創新活力,切實扭轉高校「唯帽子」傾向,提升教育治理體系和治理能力現代化水平,近日,教育部印發了《關於正確認識和規範使用高校人才稱號的若干意見
  • 高校數據治理戰略:來自加州伯克利的啟示
    全文2742字,預計閱讀5分鐘  從經驗治理到數據治理,是新時代下高校治理策略變化的應有之義。  順應時代需求  隨著大數據時代的來臨,管理與應用數據資源已成為現代高校取得競爭優勢的重要工作之一。  一方面,高校需要藉助數據治理來服務校園發展規劃,通過對學校及學科發展數據進行監測,對人力資源、科學研究、硬體環境等各項主題數據進行分析,模擬資源配置方案,進而為上層決策提供數據支撐。
  • 北京科技大學關於開展研究生課程在線教學檢查工作的通知
    2021考研的小夥伴們,在所有考研工作開展之前大家一定要多了解一下有關考研的相關動態,做好前期的準備工作,中公考研小編為各位考生整理了「北京科技大學關於開展研究生課程在線教學檢查工作的通知」的內容,希望對各位考生有所幫助。
  • 龍江高校思政行|黑龍江大學:「網際網路+」融入心理健康教育
    東北網12月7日訊(記者 王春穎 許諾)日前,「龍江高校思政行」全媒體宣傳活動正式啟動。由中央廣播電視總臺、光明日報等十餘家中央和省級主流媒體採訪團,走進黑龍江大學,集中宣傳展示該校思想政治工作方面取得的新突破、新成效、新經驗。