AI保存修繕人聲幫助解決失聲人群困擾;谷歌利用自我監督估計音高

2021-01-07 松寶寫代碼

【註:本文圖片均來源於網際網路,文章未經授權禁止轉載!部分圖片與本文無關,只為方便讀者理解,關注我們每天閱讀更多精彩內容】

1.【今日資訊頭條 | 新 AI 研究項目旨在保存修繕人聲以幫助解決失聲人群困擾】

來源:衛報

新 AI 研究項目旨在保存修繕人聲以幫助

一個旨在利用人工智慧保存和重新創建人聲的研發中心日前在美國成立,研究人員希望能該研究改變失去說話能力人群的生活。研究人員說,研究來自去波士頓東北大學與 VocaliD 公司的合資企業,其能在保持從喉癌到運動神經元疾病等疾病患者之間的認同感方面發揮重要作用。該中心的首席研究員是 VocaliD 的創始人兼執行長 Rupal Patel 教授,他認為創辦該研究中心是業界首創。

松寶有話說:新 AI 研究項目旨在保存修繕人聲以幫助解決失聲人群困擾。

2.【新聞 | 谷歌技術博客新文,SPICE:利用自我監督估計音高】

來源:谷歌 AI 博客

谷歌技術博客新文,SPICE:利用自我監

聲音的音調是對其頻率的定性度量,其中高音調的頻率比低音調的頻率高。通過跟蹤音高的相對差異,人類的聽覺系統能夠識別音頻,例如歌曲的旋律。在過去的幾十年中,音調估計已引起廣泛的關注,這是因為其在從音樂信息檢索到語音分析等多個領域中都至關重要。

以下是研究團隊在博客中做出的簡單介紹:在最近的論文中,我們提出了一種在缺少帶注釋數據的情況下訓練音高估計模型的不同方法。對於包括專業音樂家在內的人類,研究團隊受到觀察啟發,估計相對音高(兩個音符之間的頻率間隔)通常比絕對音高(真實基頻)容易得多,我們設計了 SPICE(自我監督的音高估計)解決類似的任務。

松寶有話說:谷歌技術博客新文,SPICE:利用自我監督估計音高。

3.【新聞 | 深度學習元老 Jürgen Schmidhuber 團隊的 DanNet 曾先於 AlexNet 贏得四項圖像識別挑戰賽】

來源:reddit

先於 AlexNet 贏得四項圖像識別挑戰賽

你也許還記得由 Alex Krizhevsky 和 Ilya Sutskever 和 Geoff Hinton 等人所提出的 CUDA CNN,AlexNet 於2012 年贏得了 ImageNet 挑戰賽。但你很有可能不知道在 AlexNet 之前,LSTM 發明人、 深度學習元老 Jürgen Schmidhuber 團隊憑藉其一個早期 CUDA CNN,DanNet 連續獲得了四次重大計算機視覺競賽。近日,機器學習社群網友找出了該研究,並在 reddit 與眾機器學習愛好者進行了熱烈的討論。

松寶有話說:先於 AlexNet 贏得四項圖像識別挑戰賽。

關注我們每天閱讀更多精彩內容

相關焦點

  • 在阿爾法狗完勝之後,谷歌AI「偷」走了人聲
    值得注意的是,在《愛樂之城》中客串樂手的美國著名歌手約翰·傳奇(John Legend)的聲音也將被谷歌助手採用。包括他在內,谷歌目前已經擁有六種不同的人聲。皮查伊在大會上表示:「谷歌的語音合成系統Wavenet的模型,是基於原始的音頻來創造出更加接近人類、更加自然的聲音,包括音高、語速以及停頓等。」
  • 英特爾AI如何幫助修繕殘垣斷壁的長城,背後的奧秘找到了
    你會發現,以往沒有任何一個時期,會比現在的人工智慧距離我們更近,因為它正在以一種近乎革命性的手段解決生活中真實存在的難題。現在,有一個棘手的問題擺在中國文物保護基金會面前:如何修繕一段年代久遠,已經是殘垣斷壁的箭扣長城?
  • 面對內容理解的準確性和效率問題,facebook是這樣利用自我監督技術...
    在 NLP 中,我們開發了一個共享的多語言嵌入空間,它可以作為一種語言來幫助處理有害內容,即使是用在低資源語言中也是有效的。在 CV 方面,我們在我們行業領先的研究基礎上,去識別圖像中更多部分的內容,並使用標籤來理解視頻,從而實現記錄設置的準確性。隨著我們內容理解能力的不斷提高,我們也在自我監督的新領域取得了進展。
  • 只需1 分鐘,這個網站用 AI 分離歌曲的人聲、伴奏和樂器聲
    將歌曲中的人聲和樂器聲分離是一件讓想使用音樂伴奏的人頭疼的事情,傳統的音樂製作軟體使用門檻較高,處理起來不光費時而且效果不一定好。糰子DanGo.ai(https://dango.ai/)——微博網友@無吔學生近期利用AI技術做的這個能分離音頻軌道的網站火了。在音樂分離這一領域,實際上已經有一些免費的AI工具。
  • 優必選雪梨 AI 研究院博士生:混合比例估計在弱監督學習和遷移學習...
    弱監督學習方法往往能夠減輕對正確標籤的過度依賴,達到與監督學習相近的性能。然而,在設計弱監督學習方法時,我們需要理解無標籤樣本的分布情況(比如 semi-supervised learning),或者帶噪聲標籤樣本的噪聲大小(比如 learning with label noise),這些問題的本質就是混合比例估計。因此,混合比例估計在弱監督學習中佔有至關重要的作用。
  • 谷歌利用AI教機器人「物理直覺」 從雜物堆中抓住物體準確度達87%
    谷歌利用AI教機器人「物理直覺」 從雜物堆中抓住物體準確度達87%  Emma Chou • 2019-03-27 09:21:16 來源:前瞻網 E1257G0
  • 一周AI最火論文 | 生成描述性文字的新平臺,用語言加強AI在動態...
    潛在用途:該擬議框架可以用作數據資源不足語言的有效解決方案。這些模型還可以作為將來多語言仇恨言論檢測任務的良好基準,並將對未來多語言仇恨言論檢測的研究有所幫助。研究人員可以貢獻單個的ML或AutoML雛形,並使它們易於作為基礎構件被廣泛用到,以包含在端到端解決方案中  了解更多:  https://arxiv.org/abs/1905.08942v4  用於生成動態環境及對應描述性文本的BabyAI++  本文主要研究了描述性文字幫助代理實現動態環境泛化的效果。
  • AI再發力,解決困擾生物學家近50年的一個基本問題
    蛋白質是一切生命活動的基礎物質,它是運輸氧氣的載體,是幫助抵禦病毒的抗體,也是消化食物的酶。蛋白質之所以能夠承擔多種多樣的功能,很大程度上是因為它們具有豐富而複雜的空間結構。可是,蛋白質如何摺疊成這些獨特的形狀呢?這是生物學領域的一個重大挑戰,已經困擾科學家們近50年時間。
  • 嚴格執行監督執紀規則、不斷強化自我監督之一———系列二十三...
    紀檢隊伍的作風和紀律,關乎全面從嚴治黨、黨風廉政建設和反腐敗鬥爭的成效,關乎黨的信用和形象,必須加強自身建設,嚴明政治紀律,形成有效管用的內部監督制約機制。習近平總書記每年在中央紀委全會上的重要講話,無不強調加強紀檢幹部隊伍建設,提出要解決「誰來監督紀委」的問題,要求「清理好門戶」,防止「燈下黑」,保持隊伍純潔。
  • Jeff Dean撰文:谷歌AI 2018研究成果匯總
    Google Lens可以幫助你了解你周圍的世界 在音頻領域,我們提出了一種用於語義音頻表示的無監督學習方法,以及對富有表達性的語音合成的顯著改進我們已經在這個領域進行了多年的研究,我們的長期目標是開發一種學習系統,這種系統能夠利用從以前已經解決的其他問題中獲得的見解和能力,自動地解決一個新問題。 我們在這個領域的早期工作主要是使用強化學習,但我們也對進化算法的使用感興趣。去年,我們展示了如何使用進化算法為各種視覺任務自動發現最先進的神經網絡架構。
  • 谷歌用個人位置信息製作人群流動指南,顯示隔離實際情況
    這個方案目的是幫助全世界公共衛生安全部門評估實際措施效果,並確定哪些地區需要採取進一步的計劃。例如,如果公共汽車站或火車站聚集人數過多,表明需要更多的公共汽車或火車班次。Google表示,公司公布的「人群流動指南」將使用匿名的歷史數據,在時間上滯後兩三天,覆蓋131個國家。
  • 谷歌工人工會成立,AI女倫理專家離職只是一個導火線
    其實在工會成立消息放出的前幾天,Timnit Gebru的谷歌前同事、谷歌AI倫理部門的高級研究員Alex Hanna和另一名曾經幫助領導谷歌勞工組織的NYU教授Meredith Whittaker就在寫給《連線雜誌》的一篇文章中透露了谷歌工會的信息。
  • 盲人工程師發明的「智能拐杖」,能利用谷歌地圖幫助盲人導航!
    其最好的一面,是科技能夠幫助到那些經歷過某種殘疾的人。最近,一種革命性的智能拐杖WeWalk問世了,依靠科技的力量,它可以幫助盲人更好的在城市中更有效地導航。WeWALK智能拐杖利用智能技術為視障人士提供幫助,而它大部分的技術,其實我們每天都在使用。只不過,這一次的設計,是針對看不見的人群。配備了內置揚聲器、語音助手、谷歌導航和傳感器,WeWALK能夠為盲人提供最準確的語音導航,並且可以發出震動,警告胸部以上的障礙物。目前,WeWALK已經正式上市銷售,售價約為500美元。
  • FB嵌入式人工智慧平臺發布,單目3D姿態估計新方法
    原文:https://arxiv.org/pdf/1904.01416.pdf利用卷積變分自編碼器進行單目3D姿態估計最近的研究試圖通過一個深層條件變分自動編碼器來解決2D到3D提升的固有困難。研究人員提出了一種基於深度學習的生成模型,以估計的2D姿態為條件,合成不同的3D姿態樣本。通過這樣做,他們解決了從2d到3d提升過程中遇到的模糊性。
  • 谷歌AI又有新動作,MuZero將會幫助YouTube飛速發展
    前陣子寫過一個關於谷歌旗下DeepMind的AI系統的創新故事,他們的AlphaFold解決了困擾人類長達五十年的蛋白質摺疊難題。  不曾想,才短短兩周時間過去,DeepMind最新的AI程序MuZero又有了新進展,它可以在遊戲或任務中獲得「超人性能」,無需了解規則便可快速掌握該遊戲或疑難任務。
  • 一周AI大事盤點:AI幫助農民精準除草,AI可分析動物行為
    在人工智慧的幫助下,農民不用在整塊土地上噴灑農藥,他們只需要瞄準特定的區域,在正確的時間和地點進行幹預即可。美國AI安全委員會敦促政府增加AI投資11月5日消息,據外媒報導,谷歌前任執行長埃裡克·施密特領導的顧問委員會(NSCAI)發布報告稱,美國政府在人工智慧方面的投資落後,需要增加研發投入,培養人工智慧方面的人才。
  • 一個困擾生物學家50年的問題,被AI突破了
    就算是天天研究蛋白質的科學家們,也被這個問題困擾了50年。如今有隻AI,能以前所未有的準確率預測蛋白結構。藍色為AI預測結果,綠色為標準答案丨DeepMind這隻AI名叫AlphaFold,來自谷歌然後,對比標答和選手答案之間的相似度,利用的方法叫做Global Distance Test(全球距離測試,簡稱GDT)。GDT滿分為100,通常只要選手得分超過90,就認為一道題目做對了。
  • 一個困擾生物學家50年的問題,被AI突破了
    就算是天天研究蛋白質的科學家們,也被這個問題困擾了50年。 如今有隻AI,能以前所未有的準確率預測蛋白結構。 藍色為AI預測結果,綠色為標準答案丨DeepMind 這隻AI名叫AlphaFold,來自谷歌
  • 騰訊優圖11篇論文入選,涵蓋動作識別、人群密度估計、人臉安全等領域
    本次AAAI騰訊優圖實驗室共入選了11篇論文,涉及動作識別、人群密度估計、人臉安全等領域,展現了騰訊在計算機視覺領域的技術實力。基於自適應尺度選擇的人群密度估計   To Choose or to Fuse?Scale Selection for Crowd Counting   本文提出了一種高效地充分利用網絡內部多尺度特徵表示的方法,能夠有效解決人群密度估計中的大範圍尺度變化問題。
  • 谷歌Deepmind稱解決蛋白質摺疊難題
    準確預測蛋白質的摺疊非常具有挑戰性,多年來一直困擾著很多人。」DeepMind的AlphaFold人工智慧系統參加了一項由「結構預測關鍵評估」組織(CASP)舉辦的比賽。該組織的目標是,圍繞如何計算蛋白質分子三維結構的問題,更快地尋找解決方案。