全文共1759字,預計學習時長5分鐘
圖源:unsplash
就算沒看過《哈佛商業評論》的那篇文章,但一定知道其中的著名論斷:「數據科學家是21世紀最性感的工作」。他們並不是唯一把數據科學的地位放在所有工作之上的人。
許多人似乎有一個錯誤的觀念,認為數據科學家的工作僅是日日夜夜建立這些革命性的、複雜的、有影響力的機器學習模型,然而事實並非如此。
很多人正尋求找到符合自己的興趣的職業,也有人很多人考慮轉行面對他們來說,成為一名數據科學家很可能是其心嚮往之的一條大道。大部分人可能只聽說過各種關於數據科學的溢美之辭,但本文打算潑潑冷水,筆者將提供4個為什麼你不適合成為數據科學工作的原因。
1.你不喜歡在整個職業生涯中必須不斷學習
數據科學是一個極為寬泛的術語,它對於不同的公司而言意味著不同的事物,不同的公司需要員工擁有不同的技能。例如,有些公司需要具備機器學習知識,有些公司需要會實驗設計和A/B測試,有些需要會Python編程,有些需要會R語言等等。因此,你在一家公司培養的技能不一定會讓你的整個職業生涯受益。
最重要的是,數據科學是一項多學科的工作。需要具有一定的編程、統計、數學、業務理解等方面的知識,這意味著你在上述領域之一中總會有成長的空間。
最後,就像科技中所有的事物一樣,數據科學也在不斷發展。例如,TensorFlow直到2015年才創建,而現在它成為最受需要的技能之一。隨著新技術的產生和不斷改進,你也得不斷學習新技術。
2.你不喜歡「苦累活」
從事諸如構建機器學習模型之類的有趣工作,僅佔數據科學家工作的一小部分——筆者認為不到25%的時間。
你很可能會花費大量時間在理解數據、數據的來源以及操作方式上,以及準備數據(電子設計自動化、數據整理、特徵工程等)。而且如果你沒有開發良好模型所需的數據,則必須通過開發管道才能獲得所需的數據。原因很簡單,模型的性能受到用於創建模型的數據質量的限制——「錯誤輸入導致錯誤輸出。」
因此,如果你不願意在機器學習模型上做「苦累活」,那麼數據科學可能不是最佳選擇。
3.你不喜歡持續談判、溝通和教育
你必須能夠進行談判。作為數據科學家,你既是銷售代表,又是數據科學家:
· 必須將想法和新的數據科學計劃出售給業務利益相關者。
· 可能需要額外資源,例如新技術、更多的勞動力、更多的存儲空間等等。
· 需要在時間與完美之間進行談判。在某些情況下,你可能希望多花一兩周的時間來提高模型的準確性,而業務利益相關者可能看不到增量改進的價值。
你還必須是一個良好的溝通者和教育者。通常,你將與不那麼精通技術並且可能不了解你正在從事的項目的利益相關者合作。你的工作就是以一種很容易理解的方式對你的同事和利益相關者進行溝通與培訓。
同樣,還需要將數據科學項目分解為多個步驟。業務利益相關者關心進度,他們希望知道項目隨著時間的推移如何改進,而不是等待5個月才能獲得最終結果。因此,你有責任向他們傳達你的進度以及結果。
圖源:unsplash
4.你不認為自己是個善於隨機應變的人
數據科學不需要言傳身教。你有責任在一天結束時完成工作,如果發現自己陷入困境,則需要隨機應變並找到解決問題的答案。
如果你需要了解XGBoost的工作方式或如何構建API,則需要有足夠的機敏並通過觀看YouTube視頻、閱讀文檔或通過Bootcamp進行了解。同樣,你還必須主動安排與相關干係者的會議,以了解有關業務問題,預期結果和相關指標的更多信息。
如果你不具備這方面的能力,不是這種主動採取行動並堅持學習的人,那麼你可能不適合數據科學。
如果正打算進入數據科學領域,最好再深思一下,自己是否真的了解和喜歡這個行業。
留言點讚關注
我們一起分享AI學習與發展的乾貨
如轉載,請後臺留言,遵守轉載規範