大家好,我是Jack,20fall通過指南者留學成功申請到了港科大的大數據科技(Big Data Technology,以下簡稱BDT)專業,並於今年9月份正式來到了香港。
目前,我已經在科大BDT專業學習了3個月,雖然因為疫情多少還是受到了一些影響(比如CV Workshop轉為了Zoom Meeting的形式),但總體來說在這裡還是收穫良多的。今天,我就來給大家分享一下我在科大BDT專業三個月來的就讀體驗,希望可以為同樣想就讀這個專業的同學提供一些真實的參考。
一、科大BDT簡介
科大BDT專業由科大工學院開設(就是那個在QS工程&技術領域排名全球18,香港第1的工學院),作為學院裡的王牌專業,科大BDT在校外也具有很強的競爭力,和港大的數據科學(DS)碩士項目一起,被列為香港地區Tier1的計算機與數據科學MSc項目。
相信很多同學在選擇專業的時候也會在科大BDT和港大DS之間為難,其實我當時也曾想過為什麼科大BDT不直接叫DS而要叫大數據呢?
這個問題後來在上易珂教授大數據計算這門課的時候得到了解答。據他說,當時的Program Director在命名這個專業的時候不想做得過於數學化,而想將CS為主導的概念貫徹到項目裡,所以取名大數據科技。其實這種區別從開設BDT和DS的學系也能看出來,科大BDT是由計算機系主導的項目,港大DS則是數學/統計學院主導的,因此相對而言BDT的課程設置就會更偏實踐、代碼導向。
作為實踐導向的專業,科大BDT學生在就業市場還是很有競爭力的,科大CSE系除了在計算機科學領域排名不俗外(去年Times計算機科學學科排名在世界17名左右,今年在31名),也很注重和工業界的接觸,校內有很多和著名企業合作的實驗室,如微信-港科大人工智慧聯合實驗室、港科大-迅雷區塊鏈聯合實驗室等等,合作項目也有很多,總體來說能提供給學生的實踐機會還是非常豐富的。
雖然MSc的同學多以就業為主,但每年也有不少同學會選擇繼續深造。就申請港科大的PhD而言,我們可以通過Independent Project選心儀老師的項目,做出成績進一步「套瓷」,也可以通過課程以及其他活動接觸老師。此外,科大數據科學相關方向的PhD招生過程中教授們也會青睞一些讀完BDT專業的申請者。
生源方面,我身邊的同學主要來自985/211高校、中外合辦學校和境外高校的計算機/統計專業,其中最多的還是985/211高校(比例約為4:1),GPA大都在85分左右(申請的同學如果GPA上稍差的話建議突出在實習/科研/競賽三個方面的突出表現,一般來說也會有一定的加分)。
二、課程設置
就讀BDT專業的學生共需要修滿30個學分(一門課3個學分),即10門課程,之後就可以申請畢業。一般來說,大部分同學會選擇在一年內完成學業,那就意味著每學期都需要學習5門課程;如果想延長學習周期的話也可以選擇1.5年或者2年畢業,那每學期只需要選擇3-4門課程(我自己就是選擇的後者,明年應該還會和21fall的同學一起上課,有21fall決定來科大BDT的同學歡迎評論區留言私戳我~)
課程表
目前我已經上了一學期的課程,接下來我就從中選一些我接觸過的課來具體介紹一下BDT的課程。
Foundations of Data Analytics
這門課程主要學習數據分析任務的主要過程,上半學期主講機器學習分析的方法,下半學期主講數據集成、數據清洗等數據方面的理論。每堂課TA也會手把手教我們Python常用的package以及深度學習框架(TensorFlow等),對沒有Python和機器學習基礎的同學是一個很好的補課機會。在學期中我們還需要完成兩個數據分析相關的Project(一個個人的和一個小組的),組隊項目最後要進行匯報和報告撰寫。
Big Data Computing
這門課是Program Director易珂老師講的,主要介紹大數據框架Spark,也涵蓋了雲計算等topic。這門課偏向編程,上課時教授會手把手教我們用Spark編程,quiz和考試編程的比重都很大。教授還要求我們做一個Term Project,我做的是實現一個基於Spark的數據分析服務,從大數據分析,到前後端搭建,最後到部署項目實現一個服務,鍛鍊很大!總的來說,這門課能學到的還是很多。另外易珂老師的課講的真的很好!邏輯清晰又耐心,是我大學以來最喜歡的老師之一了。
Machine Learning
選課一開始機器學習課就很搶手,還吸引了很多其他專業的同學來選。這門課可以說是這學期最硬核的課了。教授講的特別細節,課上涵蓋了大量的公式手推(沒錯這基本就是數學課),稍為走神就跟不上了。雖然叫機器學習課,但傳統統計機器學習部分只佔比40%左右(因為其他課會涉及到統計機器學習),老師側重了深度學習,讓我們接觸到Transformer,BERT,GAN等相對偏前沿的知識。不僅如此,課下還有多次Assignment和Programming作業,以及一些Tutorials課和課外資料閱讀,從數量和深度來說難度都不小……
你以為這就完了嗎?還有Term Project等著你,project涵蓋了大量的自學和代碼工作,鼓勵做得新穎,比較具有挑戰性。如果這學期你看到一個BDT學生在圖書館學習,那麼ta可能一半時間都在學這門課吧。但話說回來,這門課認真學是真的完全能建立起機器學習、深度學習的認知,能理解很多模型和算法,也是我這學期學到最多東西的課了吧。
其他的幾門課也非常不錯,比如圖像處理課和文本挖掘課適合想走CV或NLP方向的同學去選;還有一門統計課,雖然我沒選但據同學說老師十分風趣,完全沒有傳統數學的枯燥性。還有一些沒選就不說啦。
實際上下學期的課在我看來更為「硬核」,有Mathematical Methods for Data Analysis數學課,還有傳說中由陳雷大佬教的「期末考試60個小時」的Knowledge數據挖掘課。
科大坊間流傳著對這門課的傳言……
此外選修課中還有比較貼近人工智慧熱門方向的課比如NLP(自然語言處理)和Deep Learning Meets CV(深度學習與計算機視覺);有一些比較有意思的課比如Data Visualization(數據可視化)和Parralel Programming(並行計算);還有一些學術工業界新方向的Special Topic課,像Introduction to BlockChain(區塊鏈),都值得選擇。
總的來說,科大BDT的課程設置還是相當合理的。對於本科計算機的同學,在BDT課程中可以學到很多Data Science技術並且夯實Machine Learning和Deep Learning方面理論基礎;對於數學統計專業的同學,BDT的課程可以讓你得到很多AI和DS方向的實踐經歷,提升代碼能力。就我而言,我本科是做軟體開發相關的,對數據科學以及人工智慧方面的了解不算很深,也相對缺乏實踐經驗。而BDT的課程恰好能夠帶給我這些方面的補充,給成為全棧的夢想添磚加瓦。
三、活動&校友資源
除了課程,BDT專業也會舉辦很多的活動,幫助大家了解行業形勢以及為之後的就業做準備;比如前段時間就剛剛舉辦了線下的微眾銀行分享會,CSE的教授和工業界大佬們在會上分享了合作項目的進展與成果,討論了新技術的發展方向,讓我受益匪淺。
在眾多活動中,讓我印象最深的是BDT的Alumni Sharing,和我想像中的「走個過場」不同,BDT專業的學長/學姐們都很熱情且積極,不僅分享量了很多碩士期間學習規劃上的心得,還分享了很多求職方面的建議和資源(求職筆面試、所在公司介紹、工作經驗等等),比原計劃的分享時間超了足足一個多小時!
最近聽說前幾屆的學長/學姐也在積極構建BDT的校友網絡組織,旨在給所有在BDT項目的同學提供更多和校友交流的資源,相信不久的將來的BDT同學們能得到到更多的Alumni Connections,期待!
四、寫在最後
回首在科大的幾個月,似乎一直專注於課業上,月代碼量也是創下了近一年的新高;相比本科階段經常參加社團、打比賽、旅遊的豐富生活,在科大BDT這3個月的生活可以說是很單調了。不過,我倒覺得這樣挺好的,這種專業的學習模式和勁頭也正是現在的我所需要的。
總的來說,雖然這裡的課業比較繁重,但這裡豐富的學習資源、耐心的老師、超級無敵解壓的圖書館海景、認真上進的同學……也都讓我受益匪淺。我也會繼續和大家一起努力,慢慢變成更加優秀的我們。
以上這就是我這幾個月在科大BDT的就讀體驗了,希望能給大家提供有用的信息,也祝願大家都能申請到心儀的學校~