整理 | AI科技大本營
出品 | AI科技大本營(公眾號id:rgznai100)
【導語】正值求職、跳槽季,無論你是換工作還是找實習,沒有真本事都是萬萬不行的,可是如何高效率複習呢?之前我們給大家推薦了一份 Python 面試寶典,收藏了近 300 道面試題,今天為為家精心準備了一份 AI相關崗位的面試題,幫大家掃清知識盲點,自信上場!
機器學習工程師面試
1、你會在時間序列數據集上使用什麼交叉驗證技術?是用k倍或LOOCV?
以上題目答案詳解:
https://www.tinymind.cn/articles/109
【推薦收藏】
機器學習教材中的 7 大經典問題
https://www.tinymind.cn/articles/83
工作中的算法工程師,很多時候,會將生活中轉瞬即逝的靈感,付諸產品化。
將算法研究應用到工作中,與純粹的學術研究有著一點最大的不同,即需要從用戶的角度思考問題。很多時候,你需要明確設計的產品特徵、提升的數據指標,是不是能真正迎合用戶的需求,這便要求算法工程師能在多個模型間選擇出最合適的那個,然後通過快速迭代達到一個可以走向產品化的結果。知識儲備作為成功的根底亦必不可少,以下是營長為你精選的算法面試,幫你檢查下自己的技能是否在線。
1. LDA(線性判別分析) 和 PCA 的區別與聯繫
2. K-均值算法收斂性的證明
3. 如何確定 LDA (隱狄利克雷模型) 中主題的個數
4. 隨機梯度下降法的一些改進算法
5. L1正則化產生稀疏性的原因
6. 如何對貝葉斯網絡進行採樣
7. 從方差、偏差角度解釋 Boosting 和 Bagging
8. ResNet的提出背景和核心理論
9. LSTM是如何實現長短期記憶功能的
10. WGAN解決了原始 GAN 中的什麼問題
以上題目答案詳解:
https://www.tinymind.cn/articles/1275
【推薦收藏】
是男人就過8題!樓教主出題,請接招
https://www.tinymind.cn/articles/47
算法和編程面試題精選TOP50!(附代碼+解題思路+答案)
https://www.tinymind.cn/articles/3759
1.什麼是深度學習?為什麼它會如此受歡迎?
3.深度學習與機器學習有什麼區別?
4.深度學習的先決條件是什麼?
5.選擇哪些工具/語言構建深度學習模型?
6.為什麼構建深度學習模型需要使用GPU?
7.何時(何處)應用神經網絡?
8.是否需要大量數據來訓練深度學習模型?
9.哪裡可以找到一些基本的深度學習項目用來練習?
10.深度學習的一些免費學習資源
最後附上深度學習的相關面試問題有哪些?
(1)深度學習模型如何學習? (2)深度學習模型有哪些局限性? (3)前饋神經網絡和遞歸神經網絡之間有什麼區別? (4)什麼是激活特徵函數? (5)什麼是CNN,它有什麼用途? (6)什麼是池化? 簡述其工作原理。 (7)什麼是dropout層,為什麼要用dropout層? (8)什麼是消失梯度問題,如何克服? (9)什麼是優化函數?說出幾個常見的優化函數。
以上題目答案詳解:
https://www.tinymind.cn/articles/608
https://www.tinymind.cn/articles/3987
https://www.tinymind.cn/articles/3768
1、求導1/x。
2、畫出log (x+10)曲線。
3、怎樣設計一次客戶滿意度調查?
4、一枚硬幣拋10次,得到8正2反。試析拋硬幣是否公平?p值是多少?
5、接上題。10枚硬幣,每一枚拋10次,結果會如何?為了拋硬幣更公平,應該怎麼改進?
6、解釋一個非正態分布,以及如何應用。
7、為什麼要用特徵選擇?如果兩個預測因子高度相關,係數對邏輯回歸有怎樣的影響?係數的置信區間是多少?
8、K-mean與高斯混合模型:K-means算法和EM算法的差別在哪裡?
9、使用高斯混合模型時,怎樣判斷它適用與否?(正態分布)
10、聚類時標籤已知,怎樣評估模型的表現?
11、為什麼不用邏輯回歸,而要用GBM?
12、每年應聘Google的人有多少?
13、你給一個Google APP做了些修改。怎樣測試某項指標是否有增長
14、描述數據分析的流程。
15、高斯混合模型 (GMM) 中,推導方程。
16、怎樣衡量用戶對視頻的喜愛程度?
17、模擬一個二元正態分布。
18、求一個分布的方差。
19、怎樣建立中位數的Estimator?
20、如果回歸模型中的兩個係數估計,分別是統計顯著的,把兩個放在一起測試,會不會同樣顯著?
以上題目答案詳解:
https://www.tinymind.cn/articles/98
1、有成千上萬個用戶,每個用戶都有 100 個交易,在 10000 個產品和小組中,用戶所參與有意義的部分,你是如何處理這一問題的?
2、為了消除欺詐行為,我們對這些數據進行預篩選,如何才能找到一個數據樣本,幫助我們判斷一個欺詐行為的真實性?
3、給出兩個表格,一個表格用來存儲用戶 ID 以及購買產品 ID(為1個字節),另一個表格則存儲標有產品名稱的產品 ID。我們嘗試尋找被同一用戶同時購買的這樣一個成對的產品,像葡萄酒和開瓶器,薯片和啤酒。那麼,如何去尋找前 100 個同時存在且成對出現的產品?
4、詳細描述 L1 正則化和 L2 正則化二者之間的區別,特別是它們本身對模型訓練過程的影響有什麼不同?
5、假設你有 10 萬個存儲在不同伺服器上的文件,你想對所有的文件進行加工,那麼用 Hadoop 如何處理?
6、Python 和 Scala 之間有什麼區別?
7、解釋一下 LRU Cache 算法。
8、如何設計一個客戶——伺服器模型,客服端每分鐘都可以發送位置數據。
9、如何將數據從一個 Hadoop 聚類傳遞給另一個 Hadoop 聚類?
10、Java 中的內存有哪些不同的類型?
11、你是如何處理數百個標題中的元數據這一繁瑣任務的?
12、在數據流和可訪問性方面,如何在隱藏時間幀內進行測量?其中在隱藏時間幀內,核心超負荷將計算機能量重定向到 cellar dome 的過度複雜文件系統的邊界結構。
13、你最希望擁有的超能力是什麼?
14、如果你有一個時間序列傳感器,請預測其下一個讀數。
15、使用 SQL 創建 market basket 輸出。
16、你有沒有過心理物理學實驗的經驗?(Research Portfolio based question)
17、你在表徵方法上的專長是什麼?通常使用什麼?你是如何在研究中使用它,有沒有什麼有趣的結果?(Research Portfolio based question)
18、如何進行故障分析?
19、檢查一個二叉樹是否為左右子樹上的鏡像。
20、什麼是隨機森林?為什麼樸素貝葉斯效果更好?
以上題目答案詳解:
https://www.tinymind.cn/articles/139
大家可在詳解頁面查找以上所有問題的答案,面試除了運氣,更多還是需要紮實的基本功。努力刷題吧,祝大家都能所向披靡,順利進入心儀的公司~
推薦閱讀:
中文任務全面超越BERT:百度正式發布NLP預訓練模型ERNIE
從Word2Vec到Bert,聊聊詞向量的前世今生(一)
華為起訴美國政府