達摩院發布業界首款語音合成算法專用AI FPGA晶片設計Ouroboros...

2021-01-13 雷鋒網

雷鋒網(公眾號:雷鋒網)消息,Hot chips 31(2019)正在美國舊金山舉行,峰會第二天阿里巴巴帶來了《Ouroboros: A WaveNet Inference Engine for TTS Applications on Embedded Devices》的演講,並發布了新一代AI語音FPGA晶片技術Ouroboros。

阿里巴巴稱,這是業界首款專用於語音合成算法的 AI FPGA晶片結構設計,能將語音生成算法的計算效率提高百倍以上。

根據阿里達摩院掃地僧的說法,用AI語音合成算法WaveNet生成1秒語音,CPU和GPU需要50秒的計算時間,但Ouroboros在FPGA環境下只要 0.3秒。
Ouroboros的一大突破,是用端上定製硬體加速技術替代雲端伺服器,避免了對網絡連接和雲端服務的強依賴性。

針對 ASIC 實現的性能仿真預估表明,Ouroboros 的設計可以實時運行 WaveNet 等業界先進的文字轉語音(TTS,Text-to-Speech)算法 ,實現實時語音合成。

另據了解,Ouroboros 技術同樣適用於達摩院於今年 7 月發布的新一代的語音合成算法KAN-TTS。該算法將商用系統裡的合成語音與原始語音的相似度提高到97%以上。

還有消息指出,Ouroboros 技術,同樣適用於達摩院於今年 7 月發布的新一代的語音合成算法KAN-TTS。該算法將商用系統裡的合成語音與原始語音的相似度提高到97%以上。Ouroboros晶片技術除了語音合成之外,還將支持AI語音識別。基於Ouroboros研發完整的語音AI晶片,有望率先在天貓精靈上落地。

雷鋒網注意到,與阿里其它近來發布的其他晶片產品一樣,這個產品的命名也很有特色。Ouroboros中文是銜尾蛇,是一個古代流傳下來的符號,形象為一條蛇(或龍)吞食自己的尾巴,結果形成一個圓環(有時亦會展示成扭紋形,即「∞」),其名字涵義為「自我吞食者」。這個符號一直都有很多不同的象徵意義,而當中最為人接受的是「無限大」、「循環」等。雷鋒網

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 達摩院語音實驗室負責人鄢志傑:智能語音爆發進入倒計時,2019語音...
    新智元專訪達摩院語音實驗室負責人鄢志傑及高級算法專家雷鳴,深度解讀核心技術。鄢志傑認為,智能語音正處於爆發前夜,2019年語音AI將在特定領域通過圖靈測試。當前業界商用語音合成系統 (紅框標識) 合成語音與錄音 (Recording) 相似度大約在85~%90%的水平。達摩院內部評測結果顯示,KAN-TTS技術令合成語音自然度顯著提升。詳見後文「詳解達摩院KAN-TTS技術」。
  • 平頭哥發布含光 800:高性能 AI 推理晶片
    去年 9 月在杭州雲棲大會上,阿里巴巴正式宣布成立晶片公司「平頭哥半導體有限公司」,它由阿里去年 4 月收購的國產晶片企業中天微與阿里旗下達摩院晶片團隊整合而成,「平頭哥」自此橫空出世。
  • 基於DSP和FPGA的機器人聲控系統設計與實現
    本文引用地址:http://www.eepw.com.cn/article/21345.htm 本次設計採用了性價比較高的數位訊號處理晶片tms320vc5509作為語音識別處理器,具有較快的處理速度,使機器人在脫機狀態下,獨立完成複雜的語音信號處理和動作指令控制,fpga系統的開發降低了時序控制電路和邏輯電路在pcb板所佔的面積[1],使機器人的"大腦"的語音處理部分微型化、低功耗。
  • 達摩院2021十大科技趨勢,一起看未來
    年末收官之際,阿里巴巴達摩院重磅發布2021年度十大科技趨勢。這是達摩院成立三年以來第三次發布年度科技趨勢報告,阿里雲智能研究中心攜手達摩院的科學家和業界專家人士,歷經長達3個月大量訪談交流,共同碰撞觀點,深入探討,對人工智慧、物聯網、量子計算、雲計算、區塊鏈、新材料等熱點科技做出研判和預測,對未來的科技走向進行解讀。
  • 基於C語言的設計流優化語音識別晶片結構設計
    據預測,市場對語音控制應用設備的需求將急劇增長,其推動力來自電話機市場。電話機將更多地採用語音命令進行控制。其他應用領域包括玩具和手持設備如計算器、語音控制的安全系統、家用電器及車載設備(立體聲、視窗、環境控制、車燈和導航控制)。本文從可復用和優化晶片空間的角度出發介紹語音識別晶片結構設計的種種考慮,其思路有利於開發一系列其它語音識別晶片。
  • 達摩院2021十大科技趨勢:雲原生重塑IT技術體系
    【達摩院2021十大科技趨勢】12月28日,阿里巴巴達摩院發布2021十大科技趨勢,這是達摩院成立三年以來第三次發布年度科技趨勢。達摩院認為,未來幾年,以氮化鎵和碳化矽為代表的第三代半導體材料將在材料生長、器件製備等技術上實現突破,並應用於5G基站、新能源汽車、特高壓、數據中心等新基建場景,大幅降低整體能耗。
  • 阿里達摩院發布十大科技趨勢:模塊化讓造芯像搭積木一樣簡單
    達摩院第二次預測科技走向:繼續聚焦晶片這是達摩院成立以來第二次發布科技趨勢。與去年相比,今年趨勢更加專注於落地,更加趨向於產業,也擴展了科技突破的視野範圍——從信息技術領域拓展到了新材料領域,以及怎麼用前沿技術構建新的數字經濟基礎設施,也成為了新的核心。當然,也有對上一年趨勢的延續,比如晶片,這也是達摩預測今年科技走向的焦點。
  • 應用、算法、晶片,「三位一體」淺析語音識別
    科大訊飛聯合京東發布叮咚音箱,並於2016年推出訊飛電視助理,打造智能家居領域的入口級應用。雲知聲提供物聯網人工智慧技術,通過與格力等公司合作,把自己的語音識別技術集成到終端家電產品中,另外,雲知聲發布的『Pandora』語音中控方案,能夠大幅縮短產品智能化周期。
  • 達摩院NLP團隊斬獲六項世界冠軍背後,讓AI沒有難懂的語言
    挑戰榜單只是為了驗證了技術的領先性,達摩院NLP團隊更重要的任務是把模型整合到阿里的技術平臺,並應用到阿里內部和外部客戶的產品和業務中,驗證技術為產品和業務帶來的更大價值。那麼,阿里巴巴達摩院成立三年來究竟如何收穫技術價值?
  • 達摩院2021十大科技趨勢:第三代半導體材料迎來應用爆發
    12月28日,阿里巴巴達摩院發布2021十大科技趨勢。這也是達摩院成立三年以來,第三次發布年度科技趨勢。此次年度科技趨勢中,達摩院著重強調了新材料技術可能會為未來科技發展帶來的革命。達摩院認為,未來幾年,以氮化鎵和碳化矽為代表的第三代半導體材料將在材料生長、器件製備等技術上實現突破,並應用於5G基站、新能源汽車、特高壓、數據中心等新基建場景,大幅降低整體能耗。
  • 將真人偶像「虛擬化」,環球墨非聯合阿里達摩院用AI「造星」拉近和...
    近日,環球墨非就與阿里巴巴達摩院智能語音交互技術團隊達成合作。  環球墨非與阿里巴巴聯手打造AI數字明星,利用由環球墨非國際首創的AI視效虛擬引擎,調取明星即時影像,通過量子計算合成AI言語表情。並融合阿里巴巴達摩院語音技術合成的個性化語音,加載圍繞AI數字明星主題打造的專屬知識圖譜,藉助阿里雲平臺大計算輸出靈動逼真,博聞廣識的數字明星。
  • 世界第一的平頭哥晶片含光800,正式商用
    含光800是阿里巴巴平頭哥在2019杭州雲棲大會首日發布的首顆晶片,該晶片性能和能效比均為全球第一,一顆含光800的算力相當於10顆GPU,例如實時處理杭州主城區交通視頻,需要40顆傳統GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。
  • 達摩院(DAMO)是個什麼鬼?
    但今天最吸睛的還是「達摩院」,一所名字江湖氣息濃重的研究院。馬雲現場親自講述了成立它的初衷和期望,並且宣稱未來三年將投入1000億進行基礎科學研究和顛覆式創新研究。據說,目前已有十名專家加入到學術資訊委員會,主要研究量子計算、機器學習、基礎算法、網絡安全、視覺計算、自然語言處理、人機自然交互、金融科技等多個產業領域。
  • 阿里達摩院官網今日上線,5 大研究領域、14 個實驗室全公開
    目前,達摩院官網已經上線,在上面可以看到關於達摩院的最全介紹,覆蓋達摩院五大研究領域、兩大合作生態以及人才儲備和需求。長期擔任語音領域頂級學術會議及期刊專家評審。研究領域包括語音識別、語音合成、聲紋、語音交互等。曾任微軟亞洲研究院語音團隊主管研究員。
  • 基於FPGA高精度浮點運算器的FFT設計與仿真
    摘要 基於IEEE浮點表示格式及FFT算法,提出一種基2FFT的FPGA方法,完成了基於FPGA高精度浮點運算器的FFT的設計。利用VHDL語言描述了蝶形運算過程及地址產生單元,其仿真波形基本能正確的表示輸出結果。
  • 已量產業界最小尺寸矽麥晶片,通用微完成超億元B輪融資
    已量產業界最小尺寸矽麥晶片,通用微完成超億元B輪融資 麥克風晶片的研發與生產,可應用於電腦、藍牙耳機、手機等領域。
  • 達摩院骨科AI成果已被MICCAI 2020收錄
    阿里巴巴達摩院醫療AI又有了一項突破。7月9日,達摩院提出了一種AI助力骨科關節置換手術的新方法,該方法無需醫生手動操作即可自動完成術前關鍵點位的測量,並且實現了精度上的突破,相比傳統AI方法,達摩院醫療AI團隊的精度可提升2.3%以上,整個過程僅需0.3秒。
  • 阿里巴巴達摩院發布2021年十大科技趨勢
    2021-01-04 08:00:02 來源: 萬州微視界 舉報   達摩院
  • 學界 | 上海交通大學金賢敏團隊發布全球首款專用光量子計算軟體
    今天,上海交通大學金賢敏教授帶領的光子集成與量子信息實驗室發布了全球首款專用光量子計算軟體。
  • 雲知聲IPO背後:AI語音算法+晶片雙賽道,如何做「第一個吃螃蟹的人」?
    雲知聲的這次嘗試直接敲開了邁入行業的第一道大門,在隨後的算法演進過程中,雲知聲也持續將卷積神經網絡(CNN)、回歸神經網絡(RNN)、生成對抗網絡(GAN)等主流技術應用到商業實踐中,逐漸牢固自身的算法根基。