全文共2433字,預計學習時長5分鐘
1. XLNet:下一代大型自然語言處理框架
自然語言處理是目前機器學習領域最熱門的話題,本文也將從這裡開始。如果說剛過去的2018年是機器學習發展的關鍵之年,那麼2019年已然超越了它。
XLNet是目前最先進的自然語言處理框架,它給自然語言處理領域,甚至整個機器學習領域帶來了翻天覆地的變化。XLNet採用Transformer-XL作為其主幹模型。與此同時,開發者還開源了其預訓練模型,以便大眾學習使用XLNet。
到目前為止,XLNet已經在20項自然語言處理任務上超過了BERT的表現,並且在18項任務上取得了當前最佳效果。下面列出了二者在閱讀理解任務的幾個常見衡量維度上的測試結果。
如果想了解更多,以下是文本分類任務的測試結果。
毫不誇張地說,XLNet的表現十分出色。
2. 在PyTorch上運行XLNet
想知道如何在自己的設備上安裝XLNet嗎?別急,這個機器學習庫可以給你及時的幫助。
如果你已經足夠了解自然語言處理的各種特點,那麼理解這個也不會太難。可是,如果是初次涉足這一領域,那最好能先花點時間通讀一下上文提及的相關資料,然後再開始。
除了預訓練模型,開發人員其實還在Google Colab上開源了全部的訓練代碼,因此大眾也可以免費利用其GPU。所以,這個自然語言處理框架絕對不容錯過。
3. Google Research Football—獨特的強化學習環境
Google Research和足球?這兩者之間有什麼關係呢?
實際上,這個機器學習庫包含一個基於開源遊戲Gameplay Football的強化學習環境。該強化學習環境由谷歌研究團隊打造,並且僅用於科學研究。以下就是在此環境中模擬出來的部分場景:
其中,智能體被訓練在一個先進的、基於物理的3D模擬環境中踢足球。過去幾年裡我也有見到一些強化學習環境,然而相比之下,這個的效果最好。
此篇論文十分有趣,如果你是一個足球迷或是一個強化學習的愛好者(或者兩者都是),那就更不容錯過。
4. CRAFT文本檢測器
這一概念非常有趣。CRAFT的全稱是Character Region Awareness for TextDetection,意為「用於文本檢測的字符區域識別」。如果你對計算機視覺感興趣,那麼最好了解一下這項技術。仔細觀察一下這些GIF圖片:
你能理解這一算法是如何運行的嗎?實際上,CRAFT能夠通過識別圖中出現的每一個字符區域來檢測文本區域。而文本的邊框只需通過在二值圖上找出最小邊界矩形即可檢測出。
如果你很熟悉目標檢測,理解CRAFT就容易的多。該倉庫已經包含了一個預訓練模型,因此無需從頭編寫這一算法。
5. MMAction—開源視頻動作分析工具箱
有過處理視頻數據經歷的人都知道,這個過程確實非常具有挑戰性,但是過後也一定會有所收穫。想想我們能從視頻中提取出的海量信息和能做的分析就可以理解這一點。
比如,該如何分析某個視頻幀中出現的動作呢?這項工作其實可以由MMAction完成。MMAction是一個基於PyTorch的開源動作分析工具包。按照它的代碼庫,MMAction能執行以下任務:
· 在剪輯後的視頻中進行動作識別。
· 在剪輯後的視頻中進行時域動作檢測(也叫做動作本地化)。
· 在剪輯後的視頻中進行時空動作檢測。
此外,MMAction的開發人員也提供了多種工具以處理不同類型的視頻數據集。為方便使用,該開源庫還提供了許多指導步驟。
6. TRAINS—神奇的自動化AI實驗管理器和版本控制器
軟體工程是成為一名數據科學家最重要、也是必備的技能,然而它的重要性卻常被忽視。知道如何建模確實很重要,但是,了解某個項目軟體層面的東西也同樣重要。
如果你之前從未聽說過版本控制,請趕緊去掃一下盲。TRAINS能夠「記錄並管理多種深度學習研究工作,並且幾乎不需要付出集成成本。」
雖然TRAINS的優點很多,但是最棒的還是它的免費開源,僅需兩行代碼即可集成TRAINS至環境中。此外,TRAINS也可以與PyTorch、TensorFlow和Keras無縫集成,並且支持Jupyter notebooks。
開發人員已經開放了相關Demo伺服器。趕緊去TRAINS試試你的代碼吧。
留言 點讚 關注
我們一起分享AI學習與發展的乾貨
如需轉載,請後臺留言,遵守轉載規範