考證歷程分享:谷歌雲專業數據工程師認證應該注意哪些?

2021-02-19 觸脈諮詢

文丨張偉松

觸脈諮詢數據工程師

最近我通過了Google Cloud Professional Data Engineer的考試並拿到了認證證書,這裡跟大家分享一下考這個證書的目的、價值,以及考試相關的一些內容,對這個感興趣的朋友,可以作為參考。

1.為什麼要考這個證書?

首先排除公司需求的角度,談一下這個證書的考取對於相關從業者來說有什麼價值。

Google Cloud Professional Data Engineer Certification其實說白了就是一個谷歌的資格認證,認證持有者在某個領域擁有了滿足一定要求的能力、水平,除了 Professional Data Engineer外,谷歌還提供了較為初級的Associate Cloud Engineer,以及同水平的Cloud Architect(雲架構師)、Cloud Developer、Cloud DevOps Engineer、Cloud Security Engineer等等,分別針對某個相關領域。

谷歌官方信息稱,經過「Google Cloud認證的用戶中有87%對雲技能更有信心」、「Professional Cloud Architect(專業雲架構師)是2019年收入最高的認證」,以及 「30%的Google Cloud認證用戶在工作中承擔了更多的責任或領導角色」。

當然,受制於環境的影響,谷歌雲在國內使用的相對較少,遠低於同類雲企業,上述的價值,可能更多體現在國外(國外含金量確實還可以)。

(在Youtube中的相關視頻,可以看到熱度還是可以的)

於我個人而言,其他的不說,通過認證考試,在相關技能上確實會有很大的提升,以一個明確的目標來進行學習,與隨機性質的自學對比,前者的效率明顯會更高一些(個人感覺)。

(事實上,類如阿里雲、亞馬遜雲也擁有類似的認證,例如阿里雲的ACP認證)

(這裡谷歌雲的Professional Data Engineer的定位,接近阿里雲認證中的專業工程師ACP中的大數據工程師+大數據分析師)

而且值得一提的是,價格上其實也差不多,阿里雲認證費1200人民幣,需要到線下進行考試,谷歌雲認證需要200刀,支持線上&線下。

那麼,Professional Data Engineer究竟需要怎樣的能力呢?

看下官網解釋:

`A Professional Data Engineer enables data-driven decision making by collecting, transforming, and publishing data. A Data Engineer should be able to design, build, operationalize, secure, and monitor data processing systems with a particular emphasis on security and compliance; scalability and efficiency; reliability and fidelity; and flexibility and portability. A Data Engineer should also be able to leverage, deploy, and continuously train pre-existing machine learning models. `

專業數據工程師通過收集、轉換和發布數據來實現數據驅動的決策。數據工程師應該能夠設計、構建、運行、保護和監控數據處理系統,特別強調安全性和遵從性;可伸縮性和效率;可靠性和忠誠;以及靈活性和可移植性。數據工程師還應該能夠利用、部署和持續培訓已有的機器學習模型。

就考試大綱、相關練習來看,考試確實還是挺切題的,上述提到的點基本都可以覆蓋上。

此外,雖然是谷歌雲的認證,但是內容上其實和開源的大數據框架體系是有所對應的,除了表現層外,在深層次中很多內容互通,這種知識&經驗是不局限於谷歌雲的。

2.關於考試

考試時長:2小時

費用:200美刀

語言:英語、日語

考試形式:線上考試&線下考試任選

推薦經驗:3年以上數據行業經驗包括1年以上使用GCP使用經驗。

我是在8月18號(2020)進行的考試,考試結束後,當場出結果,結果只有通過和不通過,也就是說不會告訴你,你的得分多少,哪道題對了,哪道題錯了。

如果你的結果是通過,那麼恭喜你,完成了第一步,但是這時你不會立即拿到證書,還會有一個人工審核的過程,這個過程又會持續7~10天,我的證書就是在8月26號才下來的(這裡因為時區問題,我的證書上顯示的是8月25號),證書下來後,你的認證身份就同步更新在Credential Holder Directory證書持有者目錄上了。

網址:

https://googlecloudcertified.credential.net/

例如:

考試可以選擇線下&線上,國內的話一般就是選擇線上,需要到考試網站進行考試時間的預約。我預約時,臨近日期都沒了,一般預約日期就是一個月以後,預約的時間段很多,此處注意時區的選擇。

預約完之後,就是準備考試了,考試前有兩件事情務必要做:

1)下載軟體Sentinel,然後完成生物識別信息的錄入(就是錄入一下人臉信息吧?個人覺得)

2)進入一個測試網站,查看你的麥克風/攝像頭/網速是否達到需求。

這塊重點說一下第二個,考試中其實並沒有需要你說話的地方,所以不用擔心口語交流的問題,但是需要麥克風開著(可能是為了確認你沒有讀題/念題,或沒有其他違禁聲音),測試的時候是在網頁上,但是——考試的時候就通過之前下載的軟體Sentinel來進行考試的,不是在網頁上!這點務必注意,因為我考試前曾很天真的想過,雖然考題文字一大段一大段的很長,但是實在不行,可以用瀏覽器的谷歌翻譯啊。

抱歉,不可以的,老老實實做閱讀理解。

(圖侵刪)

網速也是一個問題,要求的網速是1Mbps upload/1Mbps download,視頻Ping值必須小於200ms,這個要求很合理,但是如果直連國內寬帶是絕對做不到的,必須另想辦法,如果因為網速問題黑屏了,刷不出題了,那只能認倒黴了。

考試系統大概在具體預約考試時間的前10-15分鐘就可以進入了,進入後會啟動Sentinel軟體,然後全屏一個考試界面(菜單欄啥的都沒有了,考試界面會佔滿屏幕,而且要求你關閉副顯示器的連接),等待一段時間後(據說因為疫情的緣故,線上考試的人變多了,所以等待的時間也很長,我等了大概10分鐘以上,全程盯著空白的屏幕…),出現一個聊天對話框,相關監考人員接著就會出現,用英語和你交流,並逐步要求出示你的身份證件(或者護照等可以證明個人身份的證件),旋轉攝像頭檢查考試環境等等,總之檢查的很全面,甚至會要求拍攝你的桌子下面(難不成還能桌子底下蹲個人不成?)

檢查完畢,繼續重申一些考試紀律相關的內容,就可以開始考試了。

考試的形式就是選擇題,包括單選和多選,持續2小時,考試題目50道,雖然題不多,但是時間上還挺緊張的,因為題目——巨長,很長一段的描述,而且還是英文,跟做閱讀理解似的,很頭疼,可能閱讀題目就得1-2分鐘。

下面拿一道測試題為例,大家可以看一下難度:

如果50道題按難度排序從0-50,50為最難,0為最簡單,個人認為這道題難度應該在30左右,有一定難度,包括基礎概念,並且涉及到一些比較細節的內容,但是不是特別難,只要看過文檔就能做對。

難度比值低的,基本只要知道相關產品&產品的使用場景&產品的橫向對比就可以做出來了,難度更高一些,往往會涉及一些不知道寫在文檔哪個角落的嘰裡呱啦的內容,是真的難,真!心!滴!難!

所以大家可以對比衡量一下。

就題型來看,個人覺得考試考察的更多是一種認知,概念的認知、架構的認知,比如對於Spark,它不會考你Dataframe如果要轉換成另一個Dataframe,需要寫什麼樣的代碼,用到哪些方法。

它更可能會考Spark和其他同類工具對比的優勢是什麼?如何在GCP上部署Spark項目,怎樣性能更優,要達到某個業務目標,除了Spark外,還可以採用何種替代方案這一類的。(當然,有些特別難的題例外。)

3.關於備考

如果你真的決定要考這個證書,那麼就需要開始為考試進行準備了。

官方提供了很多資料可供學習,除了我們熟悉的官方文檔外(註:谷歌的文檔寫的是真好,業界楷模),還可以在Coursera上進行學習,谷歌專門設置了一個系列的課程,內容以十分鐘左右的短視頻及在線實驗、在線小測試為主(當然,也只有英文版)。

短視頻主要進行功能的說明,架構的介紹,會幫助你構建一個比較系統的認知(個人感覺)。

在線測試則是針對一個具體的業務需求,給你一個虛擬的帳號身份,允許在谷歌雲平臺上進行操作,這部分操作是百分百真實的,是完全實際的操作,而且實驗說明寫的非常詳細,個人認為很有價值。但值得一提的是,實驗主要還是流程性的,帶你進行體驗,其中很多代碼段、腳本,你按著要求一步一步做,肯定可以完成實驗,但如果你想深入了解,吃透相關功能,還是得額外花時間,逐步搞清。

Coursera上的學習,前7天免費,7天過後,¥346/月,emmmm……怎麼說呢,見仁見智吧。

另外一個備考利器是qwiklabs.com,這是一個在線實驗平臺,Coursera上的在線實驗就是在這裡進行的,裡面有非常!非常!豐富的實驗,幾乎包含了常規業務所能涉及的各個主題。

缺點就是比較貴,做實驗,需要點數,一個點數一刀,一般稍微複雜點的實驗都得好幾刀,不過好在最近搞活動,可以申請獲得一個月的免費使用。

上完了課,做夠了實驗,剩下就是刷文檔了,重點產品挨個刷、挨個上手試一下就好了。

(完)

(添加客服,可加入交流群)

備註:暱稱-地區-公司-職位

GA使用、數據學習、行業交流、乾貨分享……

相關焦點

  • 健身教練需要考哪些國際認證?【考證必讀】
    近年來,我國健身行業快速發展使健身教練成為熱門職業,數據顯示擁有國職的教練收入比沒有證書的教練平均高出12.3%。其實健身教練資格認證起源於歐美,國際認證更大的優勢是加強自身國際前沿實力。
  • 如何成為一名合格的數據工程師?
    在過去,數據工程師們需要通過利用 Informatica、Pentaho、Talend 等科技大廠發行的工具編寫複雜的 SQL 查詢命令,搭建 ETL(抽取 Extract、轉換 Transform、加載 Load)流程。當今市場對數據工程師的技能需求則變得更加寬泛,需要至少滿足以下條件:可以看出,數據工程師在專業技能方面的需求與一般的後端工程師非常類似。
  • 新華考證指南|學技術要不要考證?考哪些證書更有用?
    又是一年開學季,每年到這個時候,同學們就進入到考證的階段。但是很多同學對於考證這件事情很困惑,學技術有沒有必要考證?到底考哪些證書對未來發展更有用?怎樣才能高效考到一些含金量較高的證書?鼓勵職業院校學生在獲得學歷證書的同時,積極取得多類職業技能等級證書,其主要目的就是拓展同學們就業創業本領,讓每一位同學成為專業技能與職業素養兼備的綜合型人才,所以同學們注意了,不管你所學的是什麼,考證很有必要!
  • 盤點國家級認證的執業證書,哪些是你值得擁有的金飯碗和敲門磚
    就業率和失業率的數字都是最真實的說服數據,要想獲得高薪資、優質的資源保障就得有一技之長或者多才多藝,才能讓你在職場有一席之地。那麼考證就是你佔領高地的一塊有效的身份象徵,在目前的國家人家培養發展計劃裡,有很多技能證書的含金量是你無法想像的。或者說你沒有接觸過這些證書的相關信息,讓你的職場在通向巔峰之路多了些坎坷。
  • 一份數據工程師必備的學習資源,乾貨滿滿
    每一個數據驅動的業務都需要一個適用於數據科學管道的框架,否則就是失敗的配置。大多數人懷揣著成為數據科學家的夢想進入數據科學世界,但卻沒有意識到數據工程師是做什麼的,或者這個角色需要具備什麼能力。數據工程師是數據科學項目的重要組成部分,以至於在當今數據豐富的環境裡,產業對他們的需求正在指數式地上漲。目前,沒有統一的或者正式的學習路線可供數據工程師使用。
  • 從「考證熱」到產教融合,職業教育認證標準經歷了哪些變化?
    距相關數據顯示,在整個職業教育市場中,職業培訓市場規模佔比68%。談及職業培訓,我們最熟悉的就是各式證書了,數據統計,超八成在校學生都看重「考證」。  職業資格證書,無疑是職業能力的評價標準之一。其實,它和學歷證書背後承載的價值相同:為「人才」認證設立標準。
  • 關於考證,你需要知道的二三事
    那麼問題來了,考證究竟有多大用處?到底有哪些證值得我們去考呢?這個問題纏繞著每一位對於考證摩拳擦掌的小夥伴,那麼今天,我們就把與考證有關的,秘不傳人的究極乾貨,分享給大家。CompTIA Security+ / CASPCompTIA有2個安全相關的認證,一個是偏重技術與操作層面的Security+,包括系統、主機、應用程式、數據和網絡等基礎性的安全問題,基本的加密方法和評估審計知識。
  • 盤點大學各個專業對應必考的證書,看看你的專業應該考什麼?
    專業對口的證書:計算機類專業證書:計算機等級證書想必大家都知道的,一共有四級,四級含金量最高,同時也會專業對口的等級證書:四級包括軟體測試工程師、網絡工程師、信息安全工程師、嵌入式系統開發工程師、資料庫工程師五個科目。
  • 測試工程師應該掌握哪些技能
    我上一篇微博講了設計公司應該如何招攬合適的測試工程師,那這回就應該相應地站在測試工程師的立場來聊一聊了.這次我想講一下,作為一個集成電路的測試工程師到底應該掌握哪些技能
  • 硬核體驗:裸考深度學習工程師認證考試,是一種怎樣的感受?
    不僅人工智慧領域與有榮焉,也讓深度學習算法工程師這個職業備受關注。在工業界,深度學習已經成為近年來最有「錢景」的方向。谷歌微軟百度騰訊等科技大廠都在花重金招兵買馬,深度學習工程師的身價更是以243000美元的基本年薪(來自Glassdoor2018年數據)領銜整個行業。
  • 新華考證指南|學技術要不要考證?
    又是一年開學季,每年到這個時候,同學們就進入到考證的階段。但是很多同學對於考證這件事情很困惑,學技術有沒有必要考證?到底考哪些證書對未來發展更有用?怎樣才能高效考到一些含金量較高的證書? 根據國務院發布的《國家職業教育改革實施方案》,從2019年開始,在職業院校啟動「學歷證書+若干職業技能等級證書」制度試點工作。
  • CISSP認證介紹及學習歷程分享
    一、簡介CISSP是「(ISC)²註冊信息系統安全專家」,是由(ISC)²組織和管理,是目前全球範圍內最權威、最專業、最系統的信息安全認證
  • 數據科學家含金量最高的5個數據科學認證,先馬後看!
    Tableau這個證書可能有些人會不同意,不過你還是應該認真考慮一下。Tableau是描述指標和統計數據的可視化工具,因此可能更像是數據分析或商業智能方面的技能。這個認證將檢驗你對以下主要複雜概念的理解:界定ML問題 開發ML模型 構建ML解決方案 自動化和編排ML管道 準備和處理數據 監控,優化和維護ML解決方案你可以選擇beta版認證,通過了即獲得Google Cloud認證,可以節省40%的費用,同時還可以獲得Google獨家定製服裝。這個證書的名稱是:專業機器學習工程師BETA。
  • 為什麼需要獲得Microsoft認證:Azure AI工程師助理認證?
    對人工智慧相關專業的需求正以驚人的速度增長。同樣,對Azure AI工程師的需求也越來越高。對於IT專業人員來說,許多其他與AI有關的認證也可能是不錯的選擇。但是,MS Azure通過創新的服務產品和先進的技術確保了快速發展的人工智慧領域。因此,在過去的幾十年中,對Microsoft Azure AI工程師助理認證的需求已在很大程度上增加。
  • 山西新華考證指南|學技術要不要考證?
    又是一年開學季,每年到這個時候,同學們就進入到考證的階段。但是很多同學對於考證這件事情很困惑,學技術有沒有必要考證?到底考哪些證書對未來發展更有用?怎樣才能高效考到一些含金量較高的證書?鼓勵職業院校學生在獲得學歷證書的同時,積極取得多類職業技能等級證書,其主要目的就是拓展同學們就業創業本領,讓每一位同學成為專業技能與職業素養兼備的綜合型人才,所以同學們注意了,不管你所學的是什麼,考證很有必要!
  • 建築人應該考哪些證書?10年經驗的工程師告訴你,千萬別亂考!
    那麼,建築人應該考哪些證書?10年經驗的工程師告訴你,千萬別亂考!一、建築業有哪些高含金量證書1、建造師建築圈兒裡曾經流行過這麼一句話,「二建可以養車,一建可以養房,消防工程師可以養娃」。足以見得這幾張證書的含金量。在國家未整治掛證之前,二建一年的掛靠費用都能拿到兩萬左右,一建部分省份的掛靠費用更是高達4萬!
  • 谷歌雲的初體驗 - Minecraft Server
    一咬牙,一跺腳,想想世界末日都快到了,對那種需要提供個人信用卡信息的雲伺服器的恐懼感已經變得越來越淡,為了下一代能快樂的玩耍,我決定來一把google cloud谷歌雲的初體驗。其實谷歌雲提供一年的免費使用,通過提供500澳幣左右的credit,可以讓你了解一下它的服務,用了覺得好之後,可以選擇升級為付費用戶,否則不會自動扣款。
  • 考證了解一下!2020年需要知道的九大數據科學認證
    1.IBM數據科學專業人員認證· 所用時長:3個月(可靈活調整)· 水平等級:初學者· 平臺:Coursera· 收穫:· 數據挖掘與分析· 分享見解· 理解畫面概念· 及時性原則3.哈佛數據科學專業證書
  • 一份數據工程師必備的學習資源,乾貨滿滿(附連結)
    ,最後介紹行業內認可度較高的3種數據工程認證。我寫這篇文章的目的是幫助那些想成為數據工程師,但卻不知道從哪裡開始以及從哪裡找到學習資源的人。本文中,我列出了所有有抱負的數據工程師需要知道的事情。首先,我們將了解什麼是數據工程師,以及該角色和數據科學家的區別,然後將繼續討論你的技能寶箱中應該有的核心技能,以便完全勝任這個工作,最後我還提到了一些應該考慮的行業認可證書。好了,讓我們直接開始吧!
  • 學IT到底要不要考證?看看這幾個差別就知道了……
    那麼,身為技術股的IT人才有沒有必要考證?要考哪些證?且看小編為你們好好分析分析:在職場競爭越發殘酷的當今社會,證書就像一塊砝碼,能增加獲取工作機會的競爭力,當很多人一起去爭搶一份好工作時,「證書」這樣的硬條件往往就會卡掉很大一部分人。等到入職後,證書往往還能成為升職加薪的利器。