在過去一個月中,15篇最值得閱讀的AI文章(附連結):
1、沃森的創造者想教人工智慧一個新把戲:常識
2011年,超級計算機「深藍」的繼任者「沃森」在問答遊戲《危險邊緣!》中擊敗多名人類冠軍,自此名聲大噪。
近年來,沃森的創造者大衛·費魯奇(David Ferrucci)努力向他的新發明解釋一個兒童故事,並試圖讓沃森理解將植物放在陽光下能保持健康這一常識。
因為科學家們堅信,從語言理解到機器人技術,常識是推動一切進步的關鍵。
費魯奇還提出了一個看似簡單卻很難回答的問題:「我們能讓機器真正理解它們所閱讀的內容嗎?」
連結:https://www.wired.com/story/watsons-creator-teach-ai-new-trick-common-sense/
2、公布元數據集:一種用於少鏡頭學習的數據集
少鏡頭分類是一種分類方法,其中訓練集包含的類與測試時可用的類完全不同。在這種特殊情況下,培訓過程構建了一個模型,該模型可以僅用幾個示例對新類進行分類。
現在,使用Meta Dataset,一個由Google創建的新數據集,就可以創建這種模型。
連結:https://ai.googleblog.com/2020/05/announcing-meta-dataset-dataset-of.html
3、人工智慧可以更好地檢測仇恨言論
Facebook 人工智慧部門的研究人員發布了這篇文章,解釋他們如何在臉書上對抗仇恨言論。這是他們需要完成的複雜而重要的任務之一。
為此,他們使用了本文中列出的各種人工智慧技術。現在,這些技術可以主動檢測出 88.8% 的已被刪除的仇恨言論內容。
連結:https://ai.facebook.com/blog/ai-advances-to-better-detect-hate-speech/
4、當訓練數據受性別影響時,AI 在疾病診斷方面表現更差
在構建人工智慧系統時,消除數據偏差是我們應考慮的最重要的事情之一。尤其是當我們要為某個醫療系統創建人工智慧系統時,消除數據偏差顯得尤為重要。
在本文中,作者討論了數據集中缺少不同數據的危險和這種錯誤所帶來的巨大影響,還揭示了一個令人驚訝的現象:當數據有性別之差時,疾病診斷AI將發揮失常。
連結:https://www.statnews.com/2020/05/25/ai-systems-training-data-sex-bias/
5、一個又大又壞的NLP 資料庫
連結:https://datasets.quantumstat.com/
6、40 年後,英偉達用 AI 重新創造了 PAC-MAN
自從 PAC-MAN 第一次在日本走紅並火遍全球以來,四十年過去了。而現在,由 AI 提供的復古經典已經重生:NVIDIA Research 經過 5 萬集遊戲的訓練,開發出了一款強大的新型人工智慧模型 NVIDIA GameGAN。
這是一種生成式對抗網絡,可以生成一個功能齊全的 PAC-MAN 版本,且無需底層遊戲引擎。這意味著,即使不了解基本遊戲規則,人工智慧也可以用令人信服的結果重現遊戲。酷炸了!
連結:https://blogs.nvidia.com/blog/2020/05/22/gamegan-research-pacman-anniversary/
7、人工智慧的能耗驚人
訓練人工智慧系統需要大量的處理能力,而大量的處理能力等於大量的能量消耗,這反過來又對環境有害。
這就是為什麼來自麻省理工學院的天才們開發了一種新的自動化人工智慧系統,該系統不僅提高了計算效率,還減少了AI系統的碳足跡。
連結:https://scitechdaily.com/artificial-intelligence-consumes-a-startling-amount-of-power-mit-system-reduces-the-carbon-footprint/
8、舊工具,新技巧:為數據科學家提升計算筆記本體驗
計算筆記本是一個研究從事代碼、數據和可視化工作的人所進行的豐富互動的獨特融合的理想領域。在這篇文章中,來自微軟的一個團隊討論了計算筆記本的一些問題,並給出了如何改進的建議。
文中所討論的問題是從半結構化訪談中收集的,然後該團隊對150多名數據科學家進行了調查,為了在筆記本電腦中通過示例實現編程,研究人員選擇使用微軟程序合成(Microsoft Program Synthesis)。
連結:https://www.microsoft.com/en-us/research/blog/old-tools-new-tricks-improving-the-computational-notebook-experience-for-data-scientists/
9、構成動畫師Pose Animator
GitHub上的這篇文章詳細解釋了如何使用該工具:根據PoseNet和FaceMesh的識別結果,繪製一個二維矢量圖,並對其包含的曲線進行實時動畫處理。它借鑑了計算機圖形學中基於骨架的動畫思想,並將其應用於矢量角色。
連結:https://github.com/yemount/pose-animator/
10、TensorFlow 2.2.0發布
TensorFlow 2.2.0在2.1.0版本出世的四個月後發布,本文提出新版本的主要特點和改進方面,比如一種新的用於CPU/GPU/TPU的TF 2分析器。它提供設備和主機性能分析,包括輸入管道和TF操作,並儘可能提供優化建議。
連結:https://blog.exxactcorp.com/tensorflow-2-2-0-released/
11、OpenAI首次推出帶有1750億參數的GPT-3語言模型
GPT-3是一個無監督機器學習訓練的自回歸模型,它以少量鏡頭學習為重點,在推理運行時提供任務的演示。該模型來自OpenAI,是一個帶有1750億的參數,內存700Gb的NLP模型。
實驗表明,GPT-3可以很好地生成新聞文章和任務,比如在句子中使用新單詞或執行算術,但在常識推理方面,它可能會有不足。
連結:https://venturebeat.com/2020/05/29/openai-debuts-gigantic-gpt-3-language-model-with-175-billion-parameters/
12、Facebook AI, AWS合作夥伴將發布新的PyTorch庫
這一消息來自Facebook和AWS:他們合作開發了新的PyTorch庫,目標是大規模的彈性和容錯模型培訓,以及高性能的PyTorch模型部署。
連結:https://ai.facebook.com/blog/facebook-ai-aws-partner-to-release-new-pytorch-libraries-/
13、COVID-19研究探險家
谷歌的人工智慧團隊發布了一個新工具,該工具能夠幫助研究人員遍歷大量的冠狀病毒論文、期刊和文章。
連結:https://covid19-research-explorer.appspot.com/
14、TFRT:一個全新的TensorFlowruntime
目前,人們對TensorFlow最大的抱怨可能是它的速度。這就是為什麼隨著2.2.0谷歌一起出現了TFRT——一個全新的運行時刻,它將取代現有的TensorFlow runtime,與MLIR緊密集成,負責在目標硬體上高效地執行內核。
連結:https://blog.tensorflow.org/2020/04/tfrt-new-tensorflow-runtime.html?m=1
15、關於人工智慧中的積極心理學和倫理
在一個非常有趣的採訪中,2.0 DAO Sovereign Nature Initiative的創意總監、聯合創始人Florian Schmitt和AI倫理學家John C. Havens討論了幸福的重要性以及AI如何塑造未來。
連結:https://blog.re-work.co/applications-of-gans-video-presentations/
資料來源:
https://rubikscode.net/2020/06/02/top-15-ai-articles-you-should-read-this-month-may-2020/