我做計算機視覺工程師的第一個月都學會了什麼?

2020-12-13 CSDN

作者 | Richmond Alake

譯者 | 彎月,責編 | 郭芮

頭圖 | CSDN 下載自視覺中國

以下為譯文:

我寫這篇文章的目的是為了向那些沒有接觸過機器學習行業的人們介紹一下我作為計算機視覺工程師第一個月以來的體驗,希望這些內部信息能夠讓你們在做職業選擇時有所啟發。

但是請記住,本文只是我的個人體驗,並不代表整個行業。

我將在本文中探討以下內容:

在這一個月裡我的內心充滿了恐懼視覺工程師的研究要求為什麼研究很重要哪些技術有助於以機器學習為中心的工作取得成功

恐懼與責任

老實說,我在惴惴不安中度過了第一個月。這並不是我的第一份正式工作,在成為機器學習/計算機視覺工程師之前,我曾做過三年半的Web開發。

但這次的感覺有很大的不同。我感到恐懼的原因有以下幾種:

我負責與公司產品相關的所有計算機視覺工作我們團隊非常信任我的各項決定恐懼不一定是一件壞事,我用恐懼武裝自己,迫使自己將工作做到盡善盡美,並在需要時給予100%的回報。

研究

作為公司的首位以機器學習為中心的員工,大家希望我提出最恰當的工作流程。

其中包括許多研究工作。

作為一名機器學習工程師,你必須理解各個發表論文中提及的最新技術的關鍵細節。

實現技巧對工程師至關重要,但是你必須成為該領域的專家,才能解釋清楚機器學習模型的工作原理,或為什麼選擇其中一種方法而捨棄其他方法。

在這一個月裡,我閱讀了大量有關標準計算機視覺問題解決方案的研究論文,例如姿態估計、語義分割、對象檢測等等。

技術

我們公司主要的產品以iOS移動應用的形式呈現。

而我沒有接觸過開發iOS移動應用的經驗,因此在這一個月裡我不得不熟悉Xcode(開發行動應用程式的IDE)以及Swift(蘋果的移動開發程式語言)。

很多人可能不太了解,其實一名優秀的機器學習工程師也必須掌握軟體開發的技術。

機器學習工程師的工作不僅限於Jupyter Notebook和Python腳本,而且還需要使用新的程式語言來構建網站或移動應用,這是一個非常高的要求。

每天,我都需要交替使用Swift、Python和JavaScript來完成各種不同的任務。

其中的關鍵並不是要掌握大量程式語言,而是需要具備掌握大多數程式語言基礎知識的能力。

學習面向對象編程(OOP)是一個不錯的起點。

通常,從一種程式語言中學到的知識在其他語言中也通用。

硬體

在我的個人項目中,一般我會使用Nividia Geforce GTX 1650來訓練大多數機器學習模型。但這個GPU遠遠比不上訓練最新模型所需的硬體規範。

在這一個月裡,我的任務是總結出公司應該購買的GPU工作站技術規範。

為了選擇合適的硬體組件,我需要預見未來幾個月甚至幾年我將要訓練的模型類型。

為了做出正確的決定,我不得不做大量的研究工作,搞清楚最新的研究論文採用了哪些硬體規格來訓練模型。

同樣,我還需要研究能夠支持穩定工作站的其他硬體組件。

我考慮了以下各個方面:

冷卻系統主板和處理器電源容量GPU插槽以及其他……

文檔記錄

軟體的文檔記錄過程冗長、乏味且無聊。但是將商定的技術方法全部記錄下來至關重要。

我們必須記錄採取的每項決定和方法,以方便告知團隊成員和後來的新人。

在第一個月裡,我在記錄文檔上了大約12個小時,雖然很沒意思,但非常有必要。

我記錄的內容包括:

記錄推進機器學習項目時採用的流程研究論文的摘要,方便大家快速消化重要資料關鍵項目以及軟體解決方案的實現方法GPU工作站硬體規格比較代碼內文檔,說明實現代碼的原因和邏輯各個崗位都有很多需要記錄的領域。每周都應該花費至少2個小時來專門處理文檔。

喜歡這份工作

作為公司正式的計算機視覺工程師,我在第一個月裡學習了很多有關如何應用機器學習技術的見解。

我發現,許多人可能不知道機器學習模型並不是最終產品。機器學習本身只是軟體工程中的一個環節;只有將我們的研究成果嵌入到軟體系統中,才能以創新的方式執行任務。

展望未來,第一個月的工作讓我意識到我很喜歡機器學習能夠帶來的創造性輸出。

朝著創新的目標努力可以讓平凡的模型實現、調試以及訓練任務少些無聊。

總結

在第一個月中,我實現了以下目標:

為計算機視覺的實現過程設定標準學習一種新的程式語言提供用於構建公司GPU工作站的硬體規範學習計算機視覺技術的實現技術,例如姿態估計、手勢識別和語義分割等學習TensorFlow和TensorFlow Lite在接下來的幾個月中,我將探索並實現更多最新的解決方案。希望在三個月後,我能在這個崗位上更上一層樓。

原文:https://towardsdatascience.com/my-first-month-as-a-computer-vision-engineer-5813574d394a

本文為 CSDN 翻譯,轉載請註明來源出處。

相關焦點

  • 成為一名CV(計算機視覺)工程師,你需要具備哪些能力?
    人工智慧一個很大的應用方向是CV(計算機視覺)。CV在如製造業、檢驗、文檔分析、醫療診斷和軍事等領域中各種智能系統中不可分割。具體的像無人駕駛、人臉識別、VR/AR等,未來在醫療領域等還將有更大的發展。那麼成為一名計算機視覺工程師應該具備哪些能力呢?首先數學要學好。
  • 計算機視覺新手指南
    計算機視覺技術已經通過不同的電子商務領域以及相機應用程式進入了我們的手機。 想一想當機器能夠像人眼一樣準確地看到周圍環境時,機器還有什麼是不可以做的。人眼是一個複雜的結構,它可以理解複雜的環境現象。同樣的,可以讓機器能夠看到事物並使其具有足夠的能力去理解它們所看到的內容,從而進一步對其進行分類,這項工作仍然是非常艱巨。
  • 入門計算機視覺OpenCV
    4季:計算機視覺OpenCV開營了!在計算機視覺系統裡,如何快速的進行識別,OpenCV是必不可少的基礎編程框架,從載入圖像、預處理,到目標檢測、關鍵點檢測、視頻檢測、目標追蹤等結果的可視化,都離不開OpenCV。
  • 寫給想成為前端工程師的同學們―前端工程師是做什麼的?
    從狹義上講,前端工程師使用 HTML、CSS、JavaScript 等專業技能和工具將產品UI設計稿實現成網站產品,涵蓋用戶PC端、移動端網頁,處理視覺和交互問題。從廣義上來講,所有用戶終端產品與視覺和交互有關的部分,都是前端工程師的專業領域。2005年的時候大多數網頁長這樣:
  • 連程式語言都沒有學會的計算機系畢業生,到底該學什麼呢?
    就像小編的外甥,雖然是對口專業畢業生,但是由於大學時荒廢至極,所以畢業後連相關的工作都不敢去嘗試。所以,今天,小編就給大家來聊聊「連程式語言都沒有學會的計算機系畢業生,究竟適合(可以)從事哪種崗位工作呢?」計算機專業畢業生究竟可以從事什麼崗位工作?
  • 快速掌握計算機視覺大部分領域,學習人臉圖像是唯一選擇
    文末有驚喜筆者是從傳統圖像算法開始進入計算機視覺行業的,那一批人基本上都是從人臉圖像和文本圖像開始學,而如今很多計算機視覺從業者卻從來沒有接觸過人臉圖像相關的算法,或許真的是時代變了吧。但筆者想說的是,如果你想快速系統地串聯計算機視覺領域的知識,人臉圖像應該是唯一選擇,沒有其他類型的圖像可以覆蓋底層圖像特徵,目標檢測與跟蹤,圖像分類和檢索,圖像濾波,圖像分割,三維重建,風格遷移等方向,並且能夠做到相互融合從而進行工業界落地。如果你還不知道人臉圖像能做什麼,不如看一看上面的1分鐘視頻,然後我們接下來細看到底都有些什麼。
  • 淺談計算機視覺中的圖像標註_易車網
    什麼是計算機視覺?計算機視覺被認為是機器學習和人工智慧發展的重要領域之一。簡而言之,計算機視覺是人工智慧研究領域,致力於賦予計算機看世界和視覺解釋世界的能力。更進一步的說,計算機視覺是一門研究如何使機器「看」的科學,就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。計算機視覺的應用非常廣泛,從自動駕駛汽車和無人機到醫療診斷技術和面部識別軟體,計算機視覺的應用是巨大的和革命性的。
  • 計算機視覺八大任務全概述:PaddlePaddle工程師詳解熱門視覺模型
    本文轉載自 PaddlePaddle 微信公眾號編者按:來自百度的深度學習工程師,圍繞計算機視覺領域的八大任務,包括:圖像分類、目標檢測
  • 微軟沈向洋:計算機視覺未來在語義層 「兩大一精」是關鍵
    為了更好地引導和推動我國人工智慧領域的發展,由中國人工智慧學會發起主辦,CSDN承辦的2015中國人工智慧大會(CCAI 2015)於7月26-27日在北京友誼賓館召開。我今天講的是腦科學認知的一個部分,主題是「計算機視覺的過去、現在和未來」。因為我自己選擇了機器人專業,當時實際是研究計算機視覺,我的導師對計算機語音非常的熟悉,是計算機語音的世界級專家。他問我你想學什麼,我說我想學計算機視覺,他說為什麼?我說我在文章裡看到人類認知、人類的感知,91%的信息量是從視覺來的,我說先把91%學到了,剩下的就簡單了。
  • 計算機視覺的三部曲 - 人人都是產品經理
    計算機視覺目前已經被應用到多個領域,如無人駕駛、人臉識別、文字識別、智慧交通、VA/AR、以圖搜索、醫學圖像分析等等,是人工智慧(AI)目前最火的領域之一。那計算機視覺是什麼?完整鏈路是怎樣的?有哪些技術點?本文將跟大家一起探討。
  • 專訪德國漢學家薛鳳:當歷史學家和計算機工程師同桌思考
    薛鳳掌舵的德國馬普科學史研究所在數字人文研究方面是先行者,她在專訪中說:「在我們所,計算機工程師和歷史學家是坐在一起研究的。歷史學家可能提出一個問題,然後計算機工程師負責跟歷史學家一起思考,怎麼樣用計算機方法來處理這個問題。」
  • 2013-2017:中國 CV(計算機視覺)公司恩仇錄
    基於此,計算機就可以對圖像中人的行為進行識別和分析。與此同時,趙勇也在谷歌內部尋找合伙人,先後曾有兩名工程師承諾加入,又在最後時刻反悔。這年 6 月,趙勇等來了聯合創始人何博飛。這位由徐小平介紹的合伙人簡歷相當耀眼,斯坦福商學院、新光天地、總裁等關鍵詞點綴其間。所有人都相信這是一次商業與技術人才的完美結合,必將迸射出 CV 界、甚至是科技界最絢爛的火花。
  • 計算機視覺(及卷積神經網絡)簡史
    世界範圍內的計算機方面的科學家在過去的六十年一直嘗試尋找使得機器能夠在視覺數據中提取出含義,計算機視覺的歷史是非常令人著迷的,這個方面是大多數人所不了解的。在這篇文章中,我將會嘗試介紹現代計算機視覺系統是如何通過卷積神經網絡驅動的。我將會從一個二十世紀五十年代出現的,和軟體工程毫不相關的作品開始。
  • AIR 015 | 微軟亞洲研究院常務副院長芮勇:計算機視覺從感知到認知...
    過去的50年的發展,我們可以看到,是從社群到處理到Recognition到理解,就像我們畫一幅畫一樣,從最早的線條,到一定的灰度,到最後的全彩色的,這50年都做了些什麼事情?我們可以看一看,我想用這張圖片跟大家分享一下。
  • 智能製造工程師是做什麼的_智能製造工程師要學什麼
    打開APP 智能製造工程師是做什麼的_智能製造工程師要學什麼 網絡整理 發表於 2020-03-23 14:37:56   智能製造工程師是做什麼的   主要在智能製造工程、機電及自動化工程領域從事智能產品設計及製造,數控工具機和工業機器人安裝、調試、維護和維修,智能化工廠系統集成、信息管理、應用研究和生產管理等工作。
  • LabVIEW視覺工程師,畢業工作年薪30萬起,依然無人問津?
    最近編者在某知名電子LabVIEW論壇,遇到國內某個機器視覺公司發帖招聘LabVIEW視覺工程師。但是若干天過去了,來報名參加應聘的人員,投遞簡歷的人卻很少,算得上比較專業的視覺人才幾乎沒有。「現在的問題是,投遞簡歷的人很少,但據我的了解,學習過LabVIEW的人還是挺多的。」企業招聘的人如是說。
  • 最適合初學者的18個經典開源計算機視覺項目
    老實說,我已經不記得上次一整天沒有遇到或者沒有與至少一樣計算機視覺使用樣例進行交互時什麼時候了(手機上的人臉識別)但是有一件事情就是 一 想要學習計算機視覺的人傾向與陷入理論的概念, 這是所能採取的最糟糕的路。 為了真正的學習掌握計算機視覺, 我們需要將理論與實踐相結合。並且這就是開源計算機視覺項目存在的地方。
  • 從學術研究到應用落地,這6位計算機視覺大咖在CV專場上都講了什麼?
    6月30日,CCF-GAIR大會進行到第2天,計算機視覺專場如期舉行。本專場由兩大議題組成,分別是上午場「計算機視覺前沿與智能視頻」以及下午場「計算機視覺與醫療影像分析」。本文為計算機視覺專場上半場的精選內容。在上午場的主題演講中,港科大電子及計算機工程學系助理教授、RAM-LAB主任劉明擔綱主持。
  • 計算機視覺技術發展的下一個十年
    未來十年,計算機視覺技術將取得巨大的飛躍。本篇文章回顧了在21世紀第一個10年裡計算機技術的趨勢和突破,並暢想在第二個10年,我們可以期待什麼新的趨勢以及突破。什麼是特徵工程呢?大致來說,就是我們利用我們堪稱「專家」的人類直覺來設計特殊的技巧,這些技巧在圖像中的特定模式上工作,從而為正在學習的計算機創造有用的特徵。多年來,我們積累了許多這樣的技巧,每種技巧都有自己的首字母縮寫:HOG,SIFT,ORB,甚至SURF。然而,不幸的現實是,解決現實世界的問題只依賴於單一某項技術是不行的。
  • SPE工程師親述:我是如何鍾情於石油工程的
    想必每個人心中都有一個答案。美國石油工程師學會(SPE)的工程師Alahdal A. Hussein與我們分享了他的故事,高中畢業為何選擇了石油專業,為了進入石油行業他都做了哪些努力?工作中遇到種種困難,又是什麼支撐他走到今天,讓我們一起看看。小時候我不知道自己夢想中的工作是什麼,當我以優異成績高中畢業的時候,我開始認真考慮我想從事什麼職業。