SoundHound 看好語音識別技術的未來

2021-01-11 36kr

語音識別是近兩年比較熱門的一個話題,其目標是將人類的語音中的詞彙內容轉換為計算機可讀的輸入,例如按鍵、二進位編碼或者字符序列。前兩天我們介紹過一家
日本電信運營商的雲端自動實時語音翻譯服務。今天我們來介紹另一家語音識別技術公司:總部位於加州的
SoundHound。

SoundHound 創始人兼 CEO Keyvan Mohajer 在大學期間就創建過三家盈利的公司。2000年在多倫多大學本科畢業後,他意識到自己喜歡創業,並且對技術真正著迷。早期的公司雖然非常成功,但算不上真正的高科技公司。所以他打算拿一個高科技領域的博士學位,然後學以致用,創建一家高科技公司。

Mohajer 的高科技夢一發不可收拾,他進入了斯坦福電氣工程學院,並很快發現了下一次良機。他意識到有一天人們要和自己的電腦說話。他的論文研究方向就是語音識別技術,在拿到學位兩年前就創辦了 SoundHound。

目前 SoundHound 特長是提供音樂相關的信息。你只需對著 
SoundHound 應用(支持iOS、Android、塞班) 哼上幾句,它就能告訴你歌名等信息。上周發布的 Hound 應用則可以識別歌手名字和專輯名。

SoundHound 「報歌名」應用看似隨意,但後面隱藏者嚴肅的技術和商業價值。SoundHound 目前已獲得1600萬美元風投,共有55名全職員工。投資者看重的是該公司的核心技術的潛力。SoundHound 所有技術都是自己的,不像其他一些同類應用通過許可獲得核心技術,他們的技術都是自己開發,智慧財產權完全歸自己。

那麼 SoundHound 的專利技術和博士生團隊能吸引蘋果等大公司的注意嗎?比如把相關語音技術整合到蘋果 iTunes 或
網絡電臺 Pandora 裡去。SoundHound 董事會成員之一 Larry Marcus 是 Pandora 第一位投資人,也是其董事之一。Mohajer 表示目前公司主要關注音樂垂直領域,但依賴語音識別技術的計算設備會帶來巨大需求。「我已經發現千萬別考慮退出和結果,只需找到你真正喜歡的東西就好。」 Mohajer 說到。

來源:
gigaom

相關焦點

  • SoundHound:語音識別是未來趨勢
    北京時間6月3日消息,據國外媒體報導,據說消費者科技巨頭蘋果準備在其下周的舊金山開發者會 議上推出一個先進的語音功能。如此看來,語音識別技術似乎已經準備好了最終推向大眾消費市場。
  • 「搜歌利器」SoundHound 公司獲 7500 萬美元風險投資,欲將其語音...
    或許很多人不知道,專注於音樂識別服務的 SoundHound 公司已經花了十年時間研究基於人工智慧技術的應用,包括音樂識別、語音識別、以及自然語言處理。 可能很多人是通過 SoundHound 音樂識別 App了解到這家公司,用戶只需給該應用唱一段音樂,它就會自動識別是哪一首歌曲。不過,該公司希望能將這一技術平臺化,讓每一位開發人員或是具備語音識別功能的硬體,都能實現自動化語音識別功能。
  • 哼唱也能識別歌名 音樂APP聽歌識曲誰家強
    備註2:soundhound第一次無匹配結果,第二次識別錯誤歌曲,第三次無匹配結果。QQ音樂表現:原唱識別測試(成功);翻唱識別測試(成功);哼唱識別(失敗)。網易雲音樂表現:原唱識別測試(成功);翻唱識別測試(成功);哼唱識別(成功)。soundhound表現:原唱識別測試(成功);翻唱識別測試(成功);哼唱識別(失敗)。
  • 獲騰訊、美的等 1 億美元投資,AI 語音助手 SoundHound 欲進軍中國...
    資料顯示:這輪融資後, SoundHound 將加速自己旗下 Houdify 語音人工智慧平臺的國際擴張;在中國、法國和德國建立新的辦事處;並推出新的語言識別;同時將其語言技術接入到家居和汽車上。  SoundHound 的創始人兼執行長 Keyvan Mohajer 表示:「SoundHound 可能將要進入中國市場。
  • 騰訊美的入股的語音AI公司SoundHound,拿什麼挑戰谷歌亞馬遜
    說起SoundHound,可能很多人首先想到的還是這個音樂識別軟體:隨著這個功能成為每一個音樂App的標配,它也成了雞肋。那你就小看這家公司了。而是——現在,這家公司的主要產品並不是面向用戶的什麼App,而是面向企業的Houndify:一款兩年前開放的語音人工智慧服務。它可以讓各種公司公司為自己的平臺加上語音識別、語義理解、對話等功能。對於那些想要實現自然語言交互功能,卻又不想被亞馬遜、Google等巨頭的生態綁定的公司來說,Houndify簡直是最好的第三方中立選項。
  • AI語音助手SoundHound融資6億元
    5月4日消息,據VentureBeat報導,AI語音助手SoundHound宣布,它已經完成了1億美元(約合6億元)的融資,以加快其Houndify語音人工智慧(AI)平臺的國際擴張。  該公司還採用新的語言,設立新的辦事處,並將其Hound語音助手應用於家居應用和汽車等設備上。
  • SoundHound:根據哼唱的旋律找到你想要的歌曲
    殺手指數:9/10山寨指數:5/10Android下載地址:http://www.leiphone.com/wp-admin/post-new.phpiOS下載地址:http://itunes.apple.com/cn/app/soundhound/id355554941?
  • SoundHound 再也不是一個音樂識別軟體了,他要做Siri沒做到的事情
    Shazam 從音樂識別擴展到圖像識別,瞄準多屏互動和O2O,切入到整個企業營銷市場。 而另一個產品 SoundHound,看起來沒有 Shazam 這麼多動靜,直到今天——今天他們上線了新產品 Hound 的安卓內測版。 說出來嚇死你,Hound 已經秘密研發了 9 年。
  • 百度自稱漢語語音識別準確率97%
    近日舉行的中國人機語音交互領域權威的學術會議——全國人機語音通訊學術會議(NCMMSC2015)上,百度透露其在漢語語音識別方面獲得重大突破。據悉,百度研發出了基於多層單向LSTM(長短時記憶模型)的漢語聲韻母整體建模技術,並成功把連接時序分類(CTC)訓練技術嵌入到語音識別傳統技術建模框架中。
  • INTERSPEECH2020口音英語語音識別技術挑戰賽 數據堂喊你開賽!
    語音技術圈頂會之一INTERSPEECH 2020,以「Cognitive Intelligence for Speech Processing」為主題,即將登陸上海。2020口音英語語音識別技術研討會暨挑戰賽(以下簡稱2020AESRC)作為本年度INTERSPEECH的旗艦技術活動,計劃於2020年10月25日在中國上海同步舉行。
  • 2012年9月SoundHound用戶數突破1億
    音樂識別服務SoundHound可以讓用戶通過哼唱來搜索音樂,近日宣布用戶量已超過一億大關。也就是說繼上次六月更新5.0版並突破8000萬用戶數之後,三個月的時間裡SoundHound又積累了2000萬用戶,每日的平均新增用戶超過20萬,峰值達到驚人的一百萬。那麼究竟是什麼原因讓一款「找歌名」的應用增速如此火爆呢?
  • ...漢」依託科大訊飛智能語音技術實現多人互動、童生識別、聲源定位
    來源:同花順金融研究中心同花順(300033)金融研究中心7月16日訊,有投資者向科大訊飛(002230)提問, 近期比亞迪(002594)聯合華為推出了新能源智能汽車,全面搭載和應用華為的鴻蒙作業系統、智能互聯、人車互動、雲計算系統,預計未來汽車的智能化
  • 中英混合和六大方言語音輕鬆識別,百度輸入法讓你想怎麼說就怎麼說
    通過AI技術的加持,用戶通過文字、語音、表情、動作都能進行交互,還能實現一些更科幻的場景,高效便捷的同時也展現了未來智能藍圖。語音識別:四項重大語音技術突破打造最強AI輸入法當用戶開啟百度輸入法AI探索版後,點擊語音按鈕,除了可以說出你要記錄的內容,讓輸入法幫你直接錄入轉文字,還可以呼喚「小度小度」語音助手,並說出相應指令。
  • 高難度中英文混合語音識別...
    在7月3日「Baidu Create2019」百度AI開發者大會現場,百度首席技術官王海峰在演講中表示,「百度研發了流式多級的截斷注意力模型(SMLTA),使語音識別的準確率大幅提升並保持了非常高的速度,這是首個基於流式注意力的語音識別線上服務,百度輸入法語音識別的準確率因此相對提升15%以上」。
  • 百度語音識別系統DeepSpeech 2:算法識別中英文
    【環球科技綜合報導】據Inside Bigdata網站11月27日報導,百度研究院(baidu research)宣布矽谷人工智慧實驗室 (SVAIL)已經開發出了一種新型語音識別系統——深度語音識別系統(Deep Speech 2)。該系統能通過簡單學習算法準確的識別英語和漢語。具體細節刊登在預印本在線資料庫arXiv.org,Deep Speech 2:英漢端對端深度語言識別。
  • 語音識別準確率行業第一,中英、方言混輸百度輸入法都沒在怕的!
    業內首創的流式截斷多層注意力建模使其在語音輸入功能精準度方面表現突出,實現了在線語音識別、離線語音識別、中英自由說和方言自由說四大能力突出的「最強語音輸入」,語音輸入準確率及綜合表現體驗方面均處於行業首位。(百度輸入法用戶語音輸入準確率及滿意度評分)據《報告》顯示,2019年用戶語音輸入頻率明顯增加,為輸入方式增長之首。
  • 中文語音合成最高水平,百度語音技術打造全球首款地圖語音定製產品
    現場,百度語音首席架構師賈磊揭秘了這背後的技術:「百度地圖語音定製功能基於百度獨創的風格遷移技術 Meitron 模型,其特點主要體現在音色轉換、多情感朗讀和韻律遷移三個方面,從而讓語音合成的門檻大大降低,相信百度語音技術在 AI 時代擁有無限可能。」
  • 大牛講堂 | 語音專題第一講,麥克風陣列的語音信號處理技術
    麥克風陣列的語音信號處理技術熟悉人工智慧的朋友一定明白,語音交互對於人機對話交互的重要意義,而一個完整的語音交互涉及到人的語音、語義,機器的麥克風、處理器、核心算法等多個部分,是一項看似簡單,實則複雜的龐大工程!當然這是以小編的粗淺理解寫成的總結,技術講解咱還得靠大牛!
  • 聲智Cimon為華為Sound X提供核心技術支持
    即便在播放大音量音樂或多人聊天場景下,定向拾音技術也可以保障產品實現5米範圍內全方位捕捉聲音,自動識別說話者方位,及時響應反饋。對於智能音箱而言,音質的提升,不能以犧牲智能體驗為代價。聲智科技為華為Sound X獨家提供的降噪喚醒技術,以聲源定位、波束形成、噪聲抑制、混響消除等算法為核心,在嘈雜環境下依然可以準確識別用戶指令。
  • 語音識別領域跑出黑馬,雲知聲發展前景淺析
    近年來,語音識別技術取得了長足發展。基於大數據積累、深度神經網絡模型的發展及算法的迭代優化,語音識別技術準確率不斷提升,甚至達到了能夠媲美人類的地步。 中國語音產業聯盟《2015中國智能語音產業發展白皮書》數據顯示,2017年全球智能語音產業規模將首次超過百億美元,達到105億美元。在語音識別領域這個賽道上,充斥著大大小小的競爭者,國外有微軟、谷歌、IBM,國內有百度、科大訊飛、思必馳、雲知聲、出門問問等等。 智能語音識別領域公司雲知聲於前段時間宣布獲得3億元人民幣戰略投資。