【註:本文圖片均來源於網際網路,文章未經授權禁止轉載!部分圖片與本文無關,只為方便讀者理解,關注我們每天閱讀更多精彩內容】
1.【今日資訊頭條 | 新 AI 研究項目旨在保存修繕人聲以幫助解決失聲人群困擾】
來源:衛報
一個旨在利用人工智慧保存和重新創建人聲的研發中心日前在美國成立,研究人員希望能該研究改變失去說話能力人群的生活。研究人員說,研究來自去波士頓東北大學與 VocaliD 公司的合資企業,其能在保持從喉癌到運動神經元疾病等疾病患者之間的認同感方面發揮重要作用。該中心的首席研究員是 VocaliD 的創始人兼執行長 Rupal Patel 教授,他認為創辦該研究中心是業界首創。
松寶有話說:新 AI 研究項目旨在保存修繕人聲以幫助解決失聲人群困擾。
2.【新聞 | 谷歌技術博客新文,SPICE:利用自我監督估計音高】
來源:谷歌 AI 博客
聲音的音調是對其頻率的定性度量,其中高音調的頻率比低音調的頻率高。通過跟蹤音高的相對差異,人類的聽覺系統能夠識別音頻,例如歌曲的旋律。在過去的幾十年中,音調估計已引起廣泛的關注,這是因為其在從音樂信息檢索到語音分析等多個領域中都至關重要。
以下是研究團隊在博客中做出的簡單介紹:在最近的論文中,我們提出了一種在缺少帶注釋數據的情況下訓練音高估計模型的不同方法。對於包括專業音樂家在內的人類,研究團隊受到觀察啟發,估計相對音高(兩個音符之間的頻率間隔)通常比絕對音高(真實基頻)容易得多,我們設計了 SPICE(自我監督的音高估計)解決類似的任務。
松寶有話說:谷歌技術博客新文,SPICE:利用自我監督估計音高。
3.【新聞 | 深度學習元老 Jürgen Schmidhuber 團隊的 DanNet 曾先於 AlexNet 贏得四項圖像識別挑戰賽】
來源:reddit
你也許還記得由 Alex Krizhevsky 和 Ilya Sutskever 和 Geoff Hinton 等人所提出的 CUDA CNN,AlexNet 於2012 年贏得了 ImageNet 挑戰賽。但你很有可能不知道在 AlexNet 之前,LSTM 發明人、 深度學習元老 Jürgen Schmidhuber 團隊憑藉其一個早期 CUDA CNN,DanNet 連續獲得了四次重大計算機視覺競賽。近日,機器學習社群網友找出了該研究,並在 reddit 與眾機器學習愛好者進行了熱烈的討論。
松寶有話說:先於 AlexNet 贏得四項圖像識別挑戰賽。