隨著Alphago Zero無監督學習的有效實現,AI擺脫了對人工標註的過度依賴,DeepMind帶來了人工智慧算法領域的重大突破。算法、算力的不斷突破減少了對數據數量和質量的要求,人工智慧的發展速度將超出我們之前的預期。我們建議重點關注注重源頭技術創新,注重重點行業布局的科大訊飛;在垂直應用行業,我們認為人工智慧將在醫療、金融、安防等領域快速落地,對這些行業帶來破壞式創新。
推薦標的:1)科大訊飛:注重源頭技術創新,深耕教育、醫療等行業應用;2)思創醫惠:攜手Waston實現人工智慧在醫療行業的應用;3)恒生電子:Fintech龍頭,布局智能投顧、智能投資等人工智慧在金融領域的落地;4)同花順:利用人工智慧開展創新業務,如智能投顧基金、AI投資機器人等;5)衛寧健康:醫療信息化市場龍頭,成立人工智慧團隊進行醫療影像.AI研究;6)東軟集團:覆蓋醫學影像全產業鏈,並致力於提供人工智慧解決方案。
算法的突破極大降低了訓練難度與訓練時間。之前戰勝李世石的AlphaGo基本採用了傳統增強學習技術再加上深度神經網絡DNN完成搭建,而AlphaGoZero採用類似DQN的一個DNN網絡實現決策過程,可以同時輸出該步的走子策略(policy)和當前情形下的勝率值(value),能夠節省訓練時間並且能適應更多種不同情況。
網絡結構的改進實現了算力的提升。AlphaGoZero特徵提取層採用了20或40個殘差模塊,與之前AlphaGo採用的12層左右的卷積層相比,AlphaGoZero的訓練效率有了明顯的提升,僅通過4塊TPU和72小時的訓練就能夠勝過之前48塊TPU和訓練用時幾個月的的原版AlphaGo。
AlphaGoZero使擺脫對人工標註樣本依賴成為可能,對人工智慧發展極大推進。AlphaGo的算法建立在傳統的DNN網絡決策基礎上,而這對於小樣本應用領域(比如醫療圖像處理)是不可能辦到的,而AlphaGoZero通過實現「無師自通」,擺脫對人類經驗和輔助的依賴,類似的深度強化學習算法能更容易地被廣泛應用到其他人類缺乏了解或是缺乏大量標註數據的領域。