自學成才的機器學習工程師

2021-03-06 SAMshare

寫代碼可能會讓人變得有點沮喪,需要讓自己的周圍充滿色彩

自律和自學這兩個詞不能掉以輕心。一個人必須對自己的教育和啟蒙負責。如果你忽略它,別人就會為你做選擇。

1. 數學,代碼和數據是你最重要的三大項

任何有效的機器學習管道都是數學、代碼和數據的交叉。每一項只有和另一項在一起時才會有效果。

如果你的數據質量很差,那麼無論你的數學計算多麼優雅或代碼多麼高效都沒用。

如果你的數據質量最高,但你的數學計算錯誤,那麼你的結果可能會不是很好,甚至會更糟,造成傷害。

如果你的數據和數學都是世界級的,但是你的代碼效率很低,那麼你將無法獲得擴展帶來的好處。

數據為你提供了一個包含自然瑰寶的採礦地點。數學就是你的鶴嘴鋤。代碼可以讓你建立一支揮舞著鶴嘴鋤的機器人隊伍。

這三大項是你系統的輸入(你擁有的)和輸出(你想要的)之間的橋梁。

註:三大項中的數學分支也包含統計和概率。

2. 三大項之外的唯一例外

除了不能平衡這三大項之外,還有一個更大的罪過:忘記這三大項是為誰服務的。即使是執行得最好、由最優雅的數學驅動的代碼,如果不能為客戶提供服務,從最豐富的數據中獲得洞察也毫無意義。

工程師經常會發現自己迷失在一個過程中,忘記了最初想要的結果。儘管他們懷著良好的意圖進行,但他們忘記了,意圖並不像行動那麼重要。

三大項至少要為客戶提供點好處,總比什麼都不提供要好。

需要澄清的是,如果你的先進模型需要47倍的時間才能提高1%的準確率,那麼它是否提供了最好的體驗?

3. 不要被三大項給騙了

無論你多麼崇拜這三大項,你都不應該被你的愛蒙蔽。自學成才的機器學習工程師是他們自己的最大的懷疑者。

他們知道,數據不能進行證明,只能進行反駁(只要在十億數據中有一個數據點就能證明之前的概念是錯誤的),一點點糟糕的數學運算就會產生極端的後果(自然不是線性的),代碼的效率只有在它最薄弱的地方才有。

無論三大項多麼神聖,直覺也不應被忽視。如果一個結果好得令人難以置信,除非你很幸運,否則它很可能就是錯的。

4. 和你需要提供服務的客戶保持好關係

讓機器做它們擅長的事情(反覆重複過程)。讓你去做你擅長的事情時(關心、設身處地、提問、傾聽、領導、教學)。

你的客戶不像你那樣關心三大項。他們關心他們的需求是否得到滿足。

5. 向那些為你奠定基礎的人致敬

當你想到計算機、機器學習、人工智慧、數學等領域時,你會想到誰的名字?

Ada Lovelace,Geoffrey Hinton,Yann LeCun,Yoshua Bengio,Alan Turing,Fei Fei Li,Grace Hopper,Andrew Ng,Jon Von Neumann,Alan Kay,Stuart Russel,Peter Norvig?

當然,在你聽到或記住的所有名字中,有1000個名字功不可沒,但卻從歷史書中消失了。

後起之秀應該認可前輩們做出的巨大努力,但也應該認可他們中的每一個人都會告訴這位新晉的機器學習工程師同樣的事情:這個領域的未來取決於你的工作。

6. 不要低估了完全重寫的力量

你的目標應該是在第一時間構建可靠的東西。但隨著技能的提高,你可能會想重構之前的作品,拆掉它們,用新的視角重新創造它們。

自學成才的機器學習工程師都明白,就像大自然一樣,軟體和機器學習項目永遠不會完成,它們一直在運動。數據變化,代碼在新的硬體上執行,一個天才發現了一個計算高效,低內存依賴的優化器適合,並稱之為Adam。

你不僅應該對這些變化持開放態度,還應該歡迎它們。一旦它們出現,請使用你最好的判斷力來判斷它們是否值得實現到你的系統中 —— 僅僅因為有些東西是新的,並不意味著它是必需的。

7. 避免在工具上濫情

在編程界,一個常見的軼事是粉刷自行車棚。它說的是一個程式設計師,或者一組程式設計師,擔心的是車棚應該是什麼顏色,而不是問一些重要的問題,比如車棚是否真的可以存放自行車。

當然,這個自行車棚也可以用電腦程式來代替。

在機器學習的世界裡,你會聽到關於R還是Python、TensorFlow還是PyTorch、書籍還是課程、數學還是code first(兩者都有,記得這三位一體吧)、Spark還是Hadoop、Amazon Web Services還是谷歌雲平臺、VSCode還是Jupyter、Nvidia還是……的無休止的爭論。

所有的比較都是有效的,但沒有一個值得與對方爭論。

你應該回答的真正問題是:用什麼可以讓我以最快、最可靠的方式建立我的想法?

一旦你問自己這個問題,你會發現其他人都在問自己同樣的問題。

工程師的詛咒是從工具開始,然後尋找問題,而不是從問題開始,然後尋找工具,只有到了那個時候,如果沒有合適的工具,才應該去構建它。

學習資源也是如此。數學、代碼和數據的三大項,在你學習它的時候就是不變的,唯一重要的是你如何使用它。

不要忘記:許多問題可以在沒有機器學習的情況下解決。

8. 你的想法是商品

不要把一個執行好想法的人與竊取你想法的人混為一談。你的想法在別人手中比在你的頭腦中更有價值。

作為一名工程師,你的角色不僅是建立自己的想法,而且還要與他人溝通,向他們展示如何從這些想法中獲益。如果你缺乏這樣的溝通能力,你應該與有這種能力的人合作,或者尋求培養這種能力。

在一個沒人知道該相信什麼的世界裡,你可以通過做真實的自己來區分自己。誠實面對你做的東西所能提供的和你所不知道的。能夠承認自己的無知是一種優勢,而不是弱點。

好的技術總是勝利的,撒謊永遠不會勝利。構建技術。不要撒謊。

9. 你的鄰居、同事、同學和夥伴也在思考這個問題

你看到別人的進步而嫉妒嗎?或者你把它看作是你能做到的事情的動力?

你對別人的成功的感覺就是你自己成功時候的感覺。

10. 不能貪

你應該尋求建立你運用三大項的技能,回答那些你想要提供服務的人的問題,但你不應該帶著欲望這樣做。欲望會詛咒你,讓你永遠過於嚴肅地看待未來,而不是享受你現在所擁有的。

對提高技能的渴望的治療方法是培養對學習的熱愛。

自學成才的機器學習工程師能夠很快地學習利用數學、代碼和數據力量所需的概念,但不能匆忙行事。他們明白學習任何有價值的技術都需要時間,如果是這樣的話,還不如享受這個過程。

從一開始,你就是對自己的啟蒙和教育負責的人。知道了這一點,你就應該選擇那些無論你有什麼樣的運氣都能成功的項目。這個項目是否滿足了你的好奇心?它是否對你的技能構成挑戰?它可以讓你遵守這些戒律嗎?如果是這樣,就足夠了。

最後,在沿著自己的道路行進的同時,自學成才的機器學習工程師在他們的腦海中一直保持著這樣的印象:

相關焦點

  • 機器學習工程師與軟體工程師的區別是什麼?
    今天我們就來談談機器學習工程師和軟體工程師的區別。截至2020上半年,軟體工程已經激增,在國內擁有超過500萬名員工,並且預計增長不會放緩。接下來就是機器學習工程師,解決自動化或決策問題。機器學習工程-建立知識網絡機器學習工程師正在提取記錄的知識(數據)並創建決策邊界。決策邊界通常是非線性的,並且通常難以解釋(例如交易代理或機器人計劃程序),但是它們本質是由數據告知的決策邊界。
  • 機器學習自學成才的十條戒律
    在機器學習技能自學成才的過程中,我們必須對自身的教育和啟蒙負責。本文列出了十條不應掉以輕心的戒律。前車之鑑,後車之師。 在機器學習技能自學成才的過程中,我們必須對自身的教育和啟蒙負責,對下面十條戒律不應掉以輕心。前車之鑑,後車之師。任何行之有效的機器學習流水線,都是數學、編程和數據的三位一體。三個方面同等重要。
  • 這五個數據科學家和機器學習工程師油管博主,你必須關注
    這個頻道的視頻內容是萊克斯·弗裡德曼本人與電腦運算、機器學習、深度學習、人工智慧等領域的先驅或頂尖研究人員進行的簡單對話。推薦這個頻道的主要原因是,萊克斯·弗裡德曼曾與機器學習和深度學習領域的先驅進行過交流。大多數深度學習從業者多多少少會熟悉一些下列的深度學習先驅。
  • 成為數據科學家、人工智慧和機器學習工程師的自學之路
    v=zOjov-2OZ0E熟練使用一種程式語言如今,數據科學家,人工智慧和機器學習工程師使用多種語言來完成工作,其中最常用的語言是Python,R,Java,Julia和SQL。網絡抓取非常重要,我懇請每個人都學習它,因為在你作為數據科學家,人工智慧或機器學習工程師的職業生涯中可能會需要它。這是有關網絡抓取的好教程。課程連結:https://www.youtube.com/watch?
  • 你為什麼想成為機器學習工程師?是因為熱情還是熱度?
    許多工程師患上錯失恐懼症(F-O-M-O)正如我剛開始所說,機器學習不會很快過時。事實是,許多求職網站上與機器學習相關的職位發布數量躍升了90%。但困難之處在於,整整兩個月後,至少有40%的職位依然空缺。由此得知,儘管對機器學習工程師的需求很大,但人才供應是問題所在。工程師對通用化與專業化存在爭論。
  • 2019年度最佳工作榜單出爐:機器學習工程師百萬年薪奪冠
    機器學習工程師薪資近百萬人民幣,排名第一;全棧工程師多金又有閒排名第三;全行業領域的最佳工作中,科技領域佔有9席。AI崗就是最賺錢的工作。最佳崗位:機器學習工程師百萬年薪Indeed的這份榜單評選了兩個維度:時間維度:以2015年至2018年之間的工作崗位增加衡量。
  • 【全自動機器學習】ML 工程師屠龍利器,一鍵接收訓練好的模型
    對於機器學習工程師來說,AutoML 能將他們從重複勞動中解脫出來;對於機器學習菜鳥來說,再也不用擔心所選的模型不 work、超參不收斂,所需要做的只是接收訓練好的模型。  AutoML 如同倚天劍屠龍刀一般,使機器學習工程師功力大增,但這樣一件利器在不久之前似乎知曉的人並不多,2017 年 5 月 18 日,谷歌開發者大會(I/O)以「學會學習」(learning to learn)為口號,才將 AutoML 推到更多人的視野中來。
  • Indeed發布了AI 人才就業報告:機器學習工程師年薪 98 萬,但 AI...
    AI 工作熱榜:機器學習工程師穩居第一!同時,Indeed 還分析了過去一年裡人工智慧和機器學習比例最高的相關職位,結果顯示,機器學習工程師以 75% 穩居第一,深度學習工程師 60.9% 緊隨其後,第三名則被資深數據科學家以 58.1% 拿下。
  • 機器學習工程師福音:超好用的Streamlit簡介!
    全文共4706字,預計學習時長9分鐘本文將介紹一個機器學習工程師專用的應用程式框架Streamlit。根據自身經驗,每一個非平凡機器學習項目最終都布滿漏洞,其內部工具均難以維護。機器學習工程師的特殊應用程式構建流。如果工具成為主角,就需要組建工具團隊。他們可以編寫絕佳的Vue和React代碼,在筆記本電腦上貼滿聲明性框架的標籤。
  • 公司是否錄用自學成才的程式設計師?答案是更喜歡自學成才的程式設計師
    自學成才的程式設計師沒有必要擔心自己找不到工作,外面的很多網際網路企業特別是大型企業更加喜歡自學成才的程式設計師。自學只要選對方向學習,就沒有必要害怕自己學到的技術在公司用不上,這一點可以去看正規公司的招聘要求。有時是的確學到技術用不上,但記住學到的東西都是自己的。
  • 機器學習工程師面試題集錦附指南:網際網路篇
    【IT168 評論】機器學習工程師是現在的熱門職位,因為其極高的薪資成為很多技術人的晉升目標。本文總結了部分一線網際網路公司機器學習工程師的面試題及面試指南,希望對各位技術人員的進階之路有所幫助。阿里巴巴根據參加過阿里巴巴機器學習算法工程師面試的技術人員反饋,總共需要經過四輪面試,前兩輪為技術考察,第三輪是交叉面試,最後一輪是人力面試。每輪面試大概持續時間為40到50分鐘,面試內容由項目經驗詢問和基礎機器學習算法詢問兩部分組成。
  • 從蘋果店員到機器學習工程師:學習AI,我是這樣起步的
    :Daniel Bourke機器之心編譯參與:路、張倩、王淑婷機器學習工程師的職位並不只是為兩周後,執行長 Nick、首席機器學習工程師 Athon 和我去喝咖啡。Nick 問我:「你要不要加入我們團隊?」
  • 乾貨分享:自學成才,你必備的一些資源!
    放在現實社會,其實很大一部分自主創業的成功人士,都是在某個領域裡自學成才的,實乃司空見慣之象。程式設計師圈也十分常見,據最新的數據研究結果顯示:65% 的程式設計師都是自學成才。小芯會從自己最喜歡的資源說起——也是小芯第一次接觸到數據科學:數據科學和機器學習領域的Python訓練營約瑟是位了不起的講師。他會快速複習基本的Python庫,教你使用Pandas和Numpy進行數據分析,並用Matplotlib和Seaborn實現數據可視化。同時,還會學習機器學習。
  • 九大最熱門的IT崗位,機器學習竟然不是第一
    > 是全球範圍內 最受歡迎 的程式語言,PHP 是最遭人恨的(不是引戰,請往下看);有 五分之一 的軟體工程師靠 自學成才;機器學習 在大部分工程師想要學習的技術中排名 第一除了區塊鏈工程師,具有 安全專業知識的工程師 也非常搶手,這可能是由於數據洩露事故不斷增多以及消費者隱私問題日益嚴重。在過去的 12 個月中,企業對安全工程師的需求 增加了 132%。
  • 資源│機器學習、深度學習、算法工程師等 AI 相關崗位面試需要知識
    本資源整理了機器學習、深度學習、算法工程師等 AI 相關崗位面試需要知識點,常見代碼實戰(分為 C/C++和 python 版本)、常見問題,簡歷模板
  • 機器學習、數據挖掘和自然語言處理,機器學習工程師和數據科學家最應該讀的16本書
    本文經機器之心(微信公眾號:almosthuman2014)授權轉載,禁止二次轉載本文選自 Aioptify作為一位數據科學家、數據工程師或機器學習研究者關於這本書的一個有趣的事情是作者們以統計學的視角看待機器學習問題。這本書似乎過於關注理論了,所以一些讀者可能傾向於略過它。3.Pattern Recognition and Machine Learning(模式識別與機器學習)
  • 【下載】《機器學習》+《機器學習實戰》
    簡介:機器學習是計算機科學與人工智慧的重要分支領域。 本書作為該領域的入門教材,在內容上儘可能涵蓋機器學習基礎知識的各方面。目錄:全書共16 章,大致分為3 個部分:第1 部分(第1~3 章)介紹機器學習的基礎知識;第2 部分(第4~10 章)討論一些經典而常用的機器學習方法(決策樹、神經網絡、支持向量機、貝葉斯分類器
  • 機器學習在領英的規模化應用
    ,近年來湧現出越來越多本科生或者非人工智慧專業出身的工程師,他們努力學習和使用技術來改進產品,幾乎每天都有新的機器學習技術和框架發布。這篇文章將討論領英如何規模化利用技術,幫助更多工程師提升機器學習的效率。近日,領英中國機器學習研發經理李子在IEEE數據挖掘國際會議(ICDM)上分享了領英是如何規模化開展機器學習,介紹領英的核心產品以及如何利用技術幫助更多工程師提升機器學習的效率。Pro-ML提升機器學習效率
  • 想成為機器學習工程師?這份自學指南你值得收藏
    如何成長為一名機器學習工程師?經常有人這麼問,而這篇文章就嘗試回答這個問題,其中會談到關於機器學習的方方面面,從簡單的線性回歸到最新的神經網絡。你不僅將學習如何使用這些技術,還將學習如何從頭開始構建它們。這個指南主要面向計算機視覺(CV),這也是掌握一般知識的最快方式,從CV中獲取的經驗可以簡單地應用到機器學習的其他領域。
  • 國內人才報告:機器學習工程師平均薪資近3萬,頂尖者年薪可達百萬
    如下圖,自然語言處理的平均薪資為 25553 元,機器學習崗位的平均薪資為 27652 元,語音識別崗位的平均薪資為 24037 元,深度學習崗位的平均薪資為 27516 元,語音/視頻/圖形開發崗位的平均薪資為 22979 元。