明日開課:《數據科學業界實戰導覽》

2021-01-15 MarTechCareer

編者按

Trans,德勤諮詢「廣告、市場與商業」部門數據科學家,畢業於哥倫比亞大學應用分析專業。她去哥大之前,是一名營銷人,但成功從文科轉型到數據科學,並在工業界積累了廣泛的工作經驗與職場體會。從院校到工業界的角色轉換,讓她意識到數據科學學生與工業界希望招募的數據科學員工,有著多麼大的差距,而大多學生卻沒有意識到這些差距。因此她把學校裡沒有教給學生的數據科學技能全部都濃縮到了《數據科學求職升級——業界實戰導覽》這門課程(明日開課哦!)裡,希望填補知識的空白。


今天,我們採訪了Trans,近距離了解一位由文轉理的哥大學霸的蛻變飛躍

問Trans老師是通過怎樣的一個契機轉型成為數據科學家的?
我在市場數據領域工作了幾年之後,通過考入哥倫比亞大學應用分析專業讀研進修,以及大量的自學,完成了從文/商科到數據科學方向的轉型。如果有機會也希望能用我的經驗啟發或幫助更多的同學。你是如何選擇行業的?你覺得數據科學家在考慮行業時,主要有哪些考量標準?對我個人而言,由於專業上已經是一個轉型者,所以行業方面我儘可能地向自己以往的工作經驗方向上靠近:數據分析結合市場、諮詢、和項目管理,我現在所在的團隊就是德勤諮詢的「廣告、市場和商業」部門,比較符合我的定位。而如果泛化來說,行業選擇的考量標準我覺得主要有3個:個人興趣、發展前景、和準入門檻。個人興趣永遠是最重要的,職業越往後發展你會察覺到它的重要性越來越大,可以說興趣很大程度上決定了職業發展的高度甚至是工作的幸福指數。發展前景自不用說,上升期的行業機遇更多,一般如果一個行業可以幫助人們解決信息不對稱的問題(如諮詢/ 網際網路)、降低交易成本(如電商平臺)、或者增加人與人之間的連結(如社交媒體),就應該會是一個不錯的方向。最後,避免選擇準入門檻低的領域,因為職業發展的目的是建立自己的不可替代性,如果行業本身的準入門檻相對較高可以讓你的不可替代性更強。你在面試第一份數據科學家工作時,你覺得當時你最有利的武器是什麼?你在面試中的哪個環節表現得最好,讓你拿下面試?最有力的武器應該是我的個人作品集網站,它相當於一個圖文並茂版的「簡歷加github」,包含個人背景介紹、項目展示、過往經歷、聯繫信息等板塊。這個作品集網站幫助我拿到了很多的informational interview、內推、面試,我現在這份工作的offer也是通過展示作品集拿到第一輪面試的。表現的最好的環節應該是on-site面試,因為我比較擅長與人面對面的交流,不管是white board,還是考察項目,或者behavioral interview,在交互的狀態下我能更好的結合對方的反饋進行問題的解答或者演示。 疫情原因,現在networking都轉為線上了,你個人更喜歡看到什麼樣的networking message呢?希望看到對方有針對性、言簡意賅、而且能看出有提前做過功課的message,比如說兩句話介紹完個人背景,說明自己背景契合某個具體職位,表明你research後了解到的信息以及一個明確的需要幫助的點(如打15分鐘電話詢問團隊的技術棧)。需要避免的是:模板痕跡太重沒有針對性,或消息寫的過長(超過手機一屏),特別是要避免直接在互相還不認識的情況下,在第一次發送的消息中,就要求提供內推或附上簡歷要求修改簡歷。在公司裡,你現在工作負責的主要內容是什麼?你和其他行業的數據科學家最大的區別是什麼?我主要通過數據建模解答一些零售行業的關鍵性問題,比如LTV(用戶終身價值),segmentation(用戶分層),return,price optimization等,內容包括數據分析報告、機器學習建模、特徵工程和調參、模型解讀、和自動化數據管道的搭建。不同行業的數據科學工作內容相差非常大,主要因為行業本身對數據科學的接納程度和發展程度不同,比如在科技網際網路行業中應用廣泛的深度學習可能在一些傳統行業中還很少被用到,這是其一。另外就是數據科學家在不同行業中的角色分工也不同,比如IT領域多為開發人員、教育醫療領域偏向研發、消費零售領域側重企業管理等等。因此,數據科學家的工作也會相應有不同的重點方向,我的理解是:開發 - 編程工作較多;研發 - 算法較多;管理 - 商業分析更多作為一個數據科學家,您最喜歡/不喜歡工作內容的哪一部分?最喜歡的部分就是學習的機會真的特別多。從外部角度來說,數據科學這個領域本身,就始終保持著非常高的活躍度,新的概念、模型、工具、平臺層出不窮,優化著現有的解決方案,等待你去探索學習。從內部來說,團隊裡每個數據科學家都來自不同的領域,能從他們身上看到事物不同的角度。雖然其實也經常感到學習壓力和peer pressure比較大,但有壓力有挑戰性的事情才是真正能給自己帶來價值的事情,這是成長的本質。不那麼喜歡的部分可能是有時候需要花時間在環境配置和安全測試上,這方面有時甚至會花費相當長的時間,這種情況下我會覺得我沒有在做data science的工作,感到浪費了時間,不過這就是在一個組織中工作必須考慮和經歷的,我也在慢慢的學習和適應。在你工作的第一年裡,作為數據科學家你是如何適應工作環境和節奏的?剛開始會有一種迷失的感覺,迷失在大量的生產環境下的概念、專有名詞、縮寫、工具、語言中。我覺得適應環境的過程中有三點比較重要——一個是多和同組的和鄰近組的同事們交流,利用好「新人」的身份多提問,幸運的是組內的氛圍很好,給了我很大的幫助。另外就是始終和直屬上級一起商定milestones,保持積極開放的心態持續不斷的學習並且取得階段性的進展。最後一點,心態上告訴自己不要太焦慮和著急,允許自己take time,也允許自己犯錯,職業發展是一個長線的過程,穩中求進才能更長久。學生期間學的和上班後做的數據科學項目之間,最大的差別是什麼?最大的差別概括來說就是:學校中的數據科學項目是學術環境下虛擬的,主要目的是為了學習技能,是輸入;而工作中的項目是生產環境下實際的甚至實時的,主要目的是創造價值,是輸出。正是因為兩者的主要目的不同,所以數據科學項目各個層面的特性和操作方式也不同,比如說:從數據層面學校中的數據集一般都很「乾淨」,數據清理的工作量相對較小,特徵(或者列)的定義明確,總體數據量也較小,基本可以使用Python在本地處理計算;而工業界的數據集存在很多的ambiguity,模糊定義,需要反覆和提供方確認,還經常需要根據數據特徵和行業知識進行假設,然後驗證、清洗、整合,而且數據量往往非常大(特徵數量在百萬個以上),需要使用Spark和雲計算的環境進行分布式並行計算。 從模型層面,對於學生期間的項目來說,建模是項目佔比最大的一部分,而且項目重點更多的側重於模型和算法的「表現」(如誤差、準確性等),而在實際工作中,建模僅僅是整個生產鏈條中的一小部分,項目中關於模型前期的數據流接入,中期的測試、自動化pipeline搭建、部署,以及後期的協同和迭代,都是非常關鍵的組成部分,這些是學校中接觸不到的。從團隊協作層面,學校中的小組項目,組員都是同學,代碼的版本控制(如果有的話)和交付基本上在本地完成,項目周期短,基本不涉及項目管理的流程。但在工作中,項目都是不同團隊共同參與協作(比如數據科學、數據工程、產品負責人、項目負責人等等),代碼使用git/ github進行版本控制,項目流程使用agile development敏捷開發方式進行。你覺得學生求職數據科學家,最大的gap在哪裡(比如學校和工業界的gap、學生認知上的gap等等)?主要還是認知上的差距 —對技能的認知、價值的認知,和對求職策略的認知技能認知的差距主要就是上面提到的工業界和學術界的差距,當然並不是說要完全掌握工業界數據科學的所有技能,這並不現實也不需要。實際上,只要在關鍵的幾個方面(如代碼的單元測試、版本控制、Spark、Agile等)有一定的基礎了解做過一些小練習,就已經能超越其他求職者一大步。價值的認知差距集中在將數據科學項目的結果轉換成商業價值的差距,換言之,就是要轉變對數據項目的價值定義。如果說在學校,一個項目的價值體現在通過技術手段提高了模型的準確性,那麼同一個項目在工業界,就需要把模型準確度提高這個結果和商業回報聯繫起來(增加營收/ 降低成本/ 提高效率等)。而關於求職策略方面的差距,就和同學自身的定位有關了。數據科學家這個職位其實涵蓋了非常多的不同的類型,要求也各有不同,比如偏商業分析方向的(考察側重SQL和business case)、偏工程方向的(考察側重coding和ML算法)、偏研究方向的(考察側重數統知識儲備及算法),找到最適合自己的方向,找到自己的differentiator,才能事半功倍。對於那些在學校裡沒有系統地學習過編程或者數據處理的同學,你認為他們在申請數據相關崗位時有哪些小技巧可以提升自己的核心競爭力?首先,如果沒有系統的學習過編程和數據處理,那麼申請數據相關崗位的時候,就要好好考慮自己的「核心」競爭力是什麼(research? product sense? visualization? ),這個競爭力更適合什麼領域和類型的數據崗位,如何差異化競爭,然後結合這些崗位的偏好、JD描述、自己的技能水平,去查漏補缺。還可以通過Linkedin多聯繫在目標崗位就職的校友或朋友,了解更多的日常工作內容、工具和招聘要求,做到有的放矢。其次,自學數據分析時,最好可以通過做不同的項目的形式來學習(如kaggle project),並且把項目最終完成的原始碼、分析報告等上傳到你的github account,在readme file中根據STAR原則寫好項目描述,然後把github的連結放在簡歷和Linkedin Profile裡,符合招聘官」Don’t tell me, show me」的要求。進入工作後,有沒有那種「後悔」學生找工作時期沒做的事?沒有掌握的技能?這個還是挺多的,主要是對工業界數據科學的實際工作沒有一個概念,到了工作中很快就發現,學校裡學習的內容只有實際使用的十分之一,從學校到職場,技能中間出現一個斷崖,這裡面包括怎麼用命令行界面、怎麼交付代碼、版本控制、大數據的處理、生產環境下的代碼標準、pipeline搭建、敏捷開發等等等等。更要緊的是,目前市面上沒有一門課可以把工業界數據科學日常工作中最常用的工具和知識點串聯起來,集中地講解和演示。這也是我設計《數據科學求職升級——業界實戰導覽》這門課的初衷,把數據科學技能缺失的這些部分,結合我實際工作中總結的經驗,濃縮成6次導覽課,希望幫助更多的人少走彎路,降低信息不對稱,高效學習,快速入門。

◆ 數據崗位的想要大幅提升求職競爭力的在校學生(作為和其他求職者拉開差距的differentiator)


◆ 剛剛加入數據科學工作想要快速學習快速適應的初級數據科學家/分析師(當做給自己開小灶的onboarding training)


◆ 考慮轉型到數據相關領域的想要了解其中工作內容和技能的工作人士(作為轉型research的一部分和技能提升的必要訓練)

了解了這麼多工業界數據科學與校園學習的差異,怎樣在求職前搶得先機呢?MarTechApe攜手德勤諮詢數據科學家Trans老師攜手開設了《數據科學求職升級——業界實戰導覽》精品小課,為你在學校與工業界之間架起必要的橋梁!

這是目前市面上唯一一門把工業界數據科學日常中最常用的工具和知識點串聯起來集中地講解和演示的課程。

超越課本的、工業界的數據科學實際工作案例、工具、知識點。

來自紐約德勤諮詢數據科學家的第一線行業信息、工作經驗總結、工具應用詳細展示。

學習寫出商業級質量的代碼,學習使用Git和Github進行版本控制。

學習機器學習自動化pipeline的不同工具和搭建方法。

Spark、AWS等大數據與雲計算必備技能與工作流程介紹。

5次Demo手把手教你使用Github、寫PySpark代碼、搭建機器學習Pipeline、編寫Unit Tests、看懂敏捷開發任務面板

豐富的練習題與拓展學習資源。

一門課走進你的教授所不曾向你展示的真實的數據科學世界!


預售優惠(雙人團購)6折優惠:僅需¥203元人民幣/人

預售期:9/8~10/11,之後恢復原價。


課程形式是怎樣的?

課程上線時間是?

遇到課程問題如何諮詢?


還等什麼,快來跟著德勤老師一起學習工業界的數據科學吧!



相關焦點

  • 短視頻直播如何逆勢變現,開課吧誠意出品實戰訓練營
    近期,短視頻直播運營課程將在開課吧官網正式上線,有實戰訓練營與進階爆破課程兩個階段課程供選擇。該課程適合自媒體創業者、網際網路從業者、傳統行業從業者、寶爸寶媽、微商、電商從業者等對直播帶貨感興趣的學員。實戰訓練營001期將在7月下旬正式開班,歷時5周,共計20課時。進階爆破課程歷時2個月,按線上80%、線下20%的比例進行34課時的沉浸式學習,讓你開始具有前瞻的視野和格局。
  • 2019「最愛人才」系列榜單出爐 京東、開課吧等企業上榜
    (開課吧合伙人汪鴻俊)據了解,開課吧合伙人汪鴻俊主要負責開課吧和後廠理工學院的師資供給,招募和培育優秀的師資力量。此獎項是基於BOSS直聘平臺全國用戶實際行為數據評定,頒發給2019年在人才招募與培養上表現優異的企業管理者。獎項圍繞對人才的重視程度、對人才態度及崗位受關注度、人才培養等多方面指標進行綜合評選。憑藉對人才的重視與持續投入,開課吧成為泛網際網路在線新職業教育領域唯一獲獎的企業。
  • 開課吧Java培訓課程好嗎?效果怎麼樣?
    數位化人才在線教育平臺開課吧是一家整合全球知名IT和網際網路企業一線師資及實戰項目,面向廣大數位化專業和應用人才,提供熱門學科的體系化在線實戰賦能和進階課程。其中,開課吧Java課程,針對不同階段同學都設有對應的學習方向。
  • 開課吧創立後廠理工學院:一所專注前沿網際網路技術領域的創新實戰...
    8月26日,開課吧在京成功舉辦「開課吧!2019網際網路人826返校大會暨開課吧六周年戰略發布會」。發布會上,慧科創始人、董事長方業昌博士宣布開課吧創立「後廠理工學院」,原百度教育事業部總經理張高博士加入開課吧,擔任開課吧總裁,並任職後廠理工學院院長。
  • 開課吧X機械工業出版社聯合出版《數位化人才職場賦能系列叢書》
    Python數據分析入門實戰由淺入深的書寫方式可以幫助讀者輕鬆愉快的進入數據的世界。從基礎語法到高階科學計算庫,循序漸進系統講解Python數據分析所需要學習的技能樹。搭配項目實戰幫助讀者更好更快的掌握Python數據分析知識點。從入門到專精,流暢的講解了數據分析的必知必會技能。
  • 院士領銜,南大首屆「科學之光」五門通識課開課
    " 這是一場學術的盛宴,希望南大的同學們能夠從名家名師身上感受科學精神、科學風範 ……"10月10日晚,南京大學仙林校區第二教學樓燈火通明,首屆「科學之光」通識課程正式開課。開課儀式上,中科院院士、校長呂建為邢定鈺院士、祝世寧院士、陳鵬飛教授頒發南京大學首批「科學之光」首席教授聘書,並和同學們親切交流。「同學們,『科學之光』通識課是今年南大的首創,這無疑是一場學術盛宴,希望你們能從名家名師身上感受科學精神、科學風範。"
  • 聯合打造高端大數據實戰課程 後廠理工學院攜手滴滴培養高薪技術人才
    「滴滴認證-資深大數據工程師培養計劃」基于慧科與開課吧數年來在教研、師資領域的沉澱,依託於滴滴蓋亞開放數據計劃脫敏後的開放數據集,使用前沿的大數據技術對海量數據進行採集、存儲、分析處理、展現等端到端全鏈路處理過程,將理論與實戰相結合,讓學員有機會在老師的帶領下親自操盤大廠項目。與大廠合作打造高端創新實戰課程是後廠理工學院的一大特色。
  • 開課吧牽手大數據:搶奪在線教育高地的「陽謀」
    「大數據最核心的價值就是在於對於海量數據進行存儲和分析。」可以說,開課吧在教育領域對大數據技術進行了開拓型運用,玩起了搶奪在線教育高地的「陽謀」。知彼知己之謀首先,數據採集與分析使用戶的一切行為變得明朗。很多快餐式的在線教育網站可能都遇到過這類狀況,賣得風生水起的課程視頻突然就無人問津了。
  • 【實戰方法論】:如何用科學思維,貫通商業實戰,一通百通
    學習了系統的商學理論,閱讀了大量書籍 ,進行了高密度的創業實戰後,我發現可以用一個「思維」貫通所有商業實戰方法論,在實踐中用出了千變萬化。 這個思維是——科學思維! 01 什麼是科學思維?
  • 開課吧爆笑出品《職場奇葩說》
    名嘴團由著名脫口秀演員呼蘭和著名脫口秀演員史炎領銜開講;開課吧名師團是各大學科派出的資深講師,其中包括開課吧合伙人歐巖亮、開課吧AI人才事業部總經理高民權、開課吧Web課程首席顧問程劭非、開課吧產品及運營人才事業部總經理高瑋、開課吧新職課C++ 學科創始人胡光和開課吧數據應用課程教學負責人孫遜,兩大陣營實力開槓!
  • 開課吧:解密程式設計師的驕傲與低調,做好數位化人才的「擺渡人」
    隨著國家在5G、大數據、人工智慧為代表的新基建領域的大力投入,將來不僅會有更多年輕人從事與編程相關的技術工作,傳統行業數位化人才的需求也正在不斷加大。據數位化人才在線教育平臺開課吧對大量學員的採訪與調查發現,目前不僅計算機專業的學生或職場人選擇在線職業教育的比例頗高,更有許多跨專業、跨領域的職場人,也希望通過相關在線職業教育,使自己具備一定的編程能力以求提升個人職場價值,實現職業生涯轉型升級。
  • 融資50萬刀 北大博士邀100位矽谷工程師做IT培訓 10萬華人觀實戰直播
    他發現,北美地區很多華人都有IT領域培訓和就業的需求,卻苦於缺乏企業實戰項目的課程訓練。第一類稱為Master Program,專門針對急需達到科技行業企業實戰需要的用戶,提供覆蓋工業界最熱方向的課程,包括大數據、全棧開發、互動設計、數據科學、人工智慧、商業分析、後端開發、產品經理等。通過夯實的技術講解,與工業界緊密結合的實戰項目經驗,直接為用戶解決「簡歷和個人能力全面提升」的求職需求。
  • 在數據科學領域中,你需要多少數學知識?
    引言 如果你有心學習數據科學,那麼你一定會在腦海中想過下面的問題: 沒有或者只有很少的數學知識,我能做一個數據科學家嗎? 數據科學必需的數學工具有哪些? 有很多優秀的包可用於建立預測模型或者數據可視化。
  • 我在UCCA做導覽員
    自從5.26日收到UCCA面試通過的電話到今天,我已經在UCCA做了13次公眾導覽。接下來要有一段時間暫時停止這段志願,趁在飛機上得來空閒,把先前所見所聞稍做整理與你分享。來看展的觀眾大抵分為兩類,拍照的或者是看作品的。前一類人自得其樂,而顯然後一類人是我接觸更多的類型。
  • 打造智慧園區,深圳歡樂海岸上線「智慧導覽小程序」
    11月3日,「歡樂海岸智慧導覽小程序」啟動儀式暨」數字海岸」成果分享沙龍在歡樂海岸購物中心舉行。華僑城集團旅遊管理中心總經理王剛、信息中心主任李濤,深圳華僑城都市娛樂運營有限公司總經理劉洪傑、副總經理餘粵和騰訊集團高級產品經理張力文,摁下按鈕正式上線「歡樂海岸智慧導覽小程序」。
  • 展覽教育部趣味科學課開課啦!
    展覽教育部趣味科學課開課啦!本周,就讓我們一起走進這位偉大科學家傳奇的一生,學習他堅定不移的科學信念和堅持不懈的探索精神。>相信曹衝稱象、懷丙撈鐵牛等很多古老的故事大家都耳熟能詳,然而這些故事當中蘊含的科學原理或者科學方法你知道嗎?今天,就讓我們通過這堂課一同去了解吧。
  • 「數據教官」:科學分析彈著點 糾正射擊痼癖動作
    空降兵某部運用信息技術革新靶場輔助器材「數據教官」,科學優化射擊動作本報訊 鄧志強、劉治鑫報導:「有了『數據教官』,射擊成績明顯提高!」
  • 慧科高級副總裁陳瀅:開課吧打破線上學習孤獨感
    此外我們在技術上,開課吧還非常重視交互、溝通,就是你和你的小夥伴在網上進行交互溝通,這個我認為是學習非常重要的環節,因為在網上學習特別容易產生孤獨感,不像線下,這裡面我們就做了很多技術,如何跟小夥伴溝通,如何跟老師溝通,甚至我們還有引學服務,真正的有老師幫督促你學習、更好的走完流程,幫助我們今天很多人說線上學習孤獨感,我們是打破孤獨感,完成學習,所有這些都是我們開課吧的小創新,我們還會繼續比如在大數據分析等等領域
  • 大數據實戰攻略秘籍
  • 明日方舟六星狙擊早露數據匯總 硬核專業開罐頭的熊熊大小姐
    明日方舟對於本次微型故事涉及到的核心六星狙擊幹員早露,這裡帶來詳細幹員數據,根據目前的數據和簡單的推測來看,屬於相對硬核專業開罐頭的熊熊大小姐,好像初始體感和評價並不是很好。基礎數據面板(精二滿級)生命1755、攻擊1032(滿信賴+110)、防禦122、法抗0部署費用22-24、阻擋數1、攻擊間隔2.4s其他技能(精二後)特性:優先攻擊重量最重的敵人