SoundHound:語音識別是未來趨勢

2021-01-20 開源中國

     北京時間6月3日消息,據國外媒體報導,據說消費者科技巨頭蘋果準備在其下周的舊金山開發者會 議上推出一個先進的語音功能。如此看來,語音識別技術似乎已經準備好了最終推向大眾消費市場。而位於加利福尼亞州聖何塞的語音識別初創公司 SoundHound,也做好了在這個領域中大顯身手的準備。

SoundHound 的創始人和執行長Keyvan Mohajer在大學畢業之前就創辦過3個有盈利能力的公司。當他2000年從多倫多大學本科畢業後,他做了一些反省,並開始思考下一步該怎麼做。 「我意識到,儘管我是一個創業家,我喜歡創辦企業,我也對科技充滿了熱情。我早期創辦一些公司都非常成功,但它們並不完全都是高科技公司,所以我決定在更 艱深的技術領域攻讀博士學位,並應用我所學到的東西,創辦一個真正的高科技企業。」

於 是Mohajer入讀史丹福大學電機工程系,在那裡他很快就發現一個巨大的機會。 「我意識到,我們有一天將跟我們的電腦談話,而那一天會在我有生之年中來臨。」Mohajer在讀博期間研究語音識別技術,並於2007年獲得博士學位, 而在那之前兩年他就創辦了SoundHound。

SoundHound目前的主要服務是提供和音樂有關的信息。只要用戶對SoundHound應用唱或哼一首曲子,這個應用就可以找到歌曲的名稱以及其他信息。上周公司還推出了Hound應用程式:當用戶說出音樂人或專輯名稱時,這個應用就可以提供相關信息。

「說 出曲調名稱」這種SoundHound應用看似有些花哨,但卻掩蓋不了它在技術上和商業上的重要性。 SoundHound籌集了1600萬美元的風投資金,目前有55名全職員工。投資者之所以被這家公司吸引,是因為看到了SoundHound核心技術的 未來發展潛力,Mohajer表示 「我們所有的技術都是自有的,而這個領域中很多其他應用的核心技術都是授權使用的。我們建立的一切服務都有自主智慧財產權。 」

      當 Mohajer被問到,SoundHound的專有技術和博士團隊是否已經吸引了一些大公司,比如蘋果(蘋果可以在iTunes業務中集成語音搜索)以及 Pandora的興趣時,他迴避談及具體的「退出(exit)」計劃,但他指出,SoundHound的董事會成員包括拉裡·馬庫斯(Larry Marcus),此人也是Pandora的投資者和目前的董事會成員。Mohajer還暗示說,SoundHound的技術可應用於更廣泛的領域:「目前 我們只涉足了音樂這個垂直領域中……但我們認為,市場將會對依賴語音識別的計算設備產生重大的需求。」Mohajer還說:「我認為,不要去想『出口』和 結果,只要去找到你真正喜歡做的事情,這是非常重要的。」

相關焦點

  • 哼唱也能識別歌名 音樂APP聽歌識曲誰家強
    QQ音樂表現:原唱識別測試(成功);翻唱識別測試(成功);哼唱識別(失敗)。網易雲音樂表現:原唱識別測試(成功);翻唱識別測試(成功);哼唱識別(成功)。soundhound表現:原唱識別測試(成功);翻唱識別測試(成功);哼唱識別(失敗)。
  • SoundHound 再也不是一個音樂識別軟體了,他要做Siri沒做到的事情
    Shazam 從音樂識別擴展到圖像識別,瞄準多屏互動和O2O,切入到整個企業營銷市場。 而另一個產品 SoundHound,看起來沒有 Shazam 這麼多動靜,直到今天——今天他們上線了新產品 Hound 的安卓內測版。 說出來嚇死你,Hound 已經秘密研發了 9 年。
  • 騰訊美的入股的語音AI公司SoundHound,拿什麼挑戰谷歌亞馬遜
    說起SoundHound,可能很多人首先想到的還是這個音樂識別軟體:隨著這個功能成為每一個音樂App的標配,它也成了雞肋。那你就小看這家公司了。而是——現在,這家公司的主要產品並不是面向用戶的什麼App,而是面向企業的Houndify:一款兩年前開放的語音人工智慧服務。它可以讓各種公司公司為自己的平臺加上語音識別、語義理解、對話等功能。對於那些想要實現自然語言交互功能,卻又不想被亞馬遜、Google等巨頭的生態綁定的公司來說,Houndify簡直是最好的第三方中立選項。
  • 語音識別技術簡史
    本篇文章將從技術和產業兩個角度來回顧一下語音識別發展的歷程和現狀,並分析一些未來趨勢,希望能幫助更多年輕技術人員了解語音行業,並能產生興趣投身於這個行業。語音識別,通常稱為自動語音識別,英文是Automatic Speech Recognition,縮寫為 ASR,主要是將人類語音中的詞彙內容轉換為計算機可讀的輸入,一般都是可以理解的文本內容,也有可能是二進位編碼或者字符序列。
  • AI語音助手SoundHound融資6億元
    5月4日消息,據VentureBeat報導,AI語音助手SoundHound宣布,它已經完成了1億美元(約合6億元)的融資,以加快其Houndify語音人工智慧(AI)平臺的國際擴張。  該公司還採用新的語言,設立新的辦事處,並將其Hound語音助手應用於家居應用和汽車等設備上。
  • 去除免費限制 SoundHound音樂識別應用更新
    它可以通過識別聲音來知道歌曲的名稱。現在SoundHound更是決定要去除免費版本的限制。不像Shazam,SoundHound識別歌曲時不需要歌曲正在播放。SoundHound現在允許無限音樂識別。您可以標識歌曲,顯示歌詞,並瀏覽藝術家的內容資料。  其他功能還包括in-app歌詞,一個良好的iPad界面,當你頭戴耳麥而且不願拿下來時。你可以使用「啟動自動識別」選項(這樣用戶可以啟動程序時立即開始識別歌曲。)。然後再檢查SoundHound結果就行了。
  • 使用Python和Keras創建簡單語音識別引擎
    語音識別是機器或程序識別口語中的單詞和短語並將其轉換為機器可讀格式的能力。通常,這些算法的簡單實現有一個有限的詞彙表,它可能只識別單詞/短語。但是,更複雜的算法(例如Google的Cloud Speech-to-Text和Amazon Transcribe)具有廣泛的詞彙量,並包含方言、噪音和俚語。
  • 從不溫不火到炙手可熱:語音識別技術簡史
    【導讀】語音識別自半個世紀前誕生以來,一直處於不溫不火的狀態,直到 2009 年深度學習技術的長足發展才使得語音識別的精度大大提高,雖然還無法進行無限制領域、無限制人群的應用,但也在大多數場景中提供了一種便利高效的溝通方式。本篇文章將從技術和產業兩個角度來回顧一下語音識別發展的歷程和現狀,並分析一些未來趨勢,希望能幫助更多年輕技術人員了解語音行業,並能產生興趣投身於這個行業。
  • 應用、算法、晶片,「三位一體」淺析語音識別
    現階段,在理想的環境下,多家公司的語音識別系統已經越過了實用的門檻,並在各個領域得到了廣泛的應用。人工智慧產業鏈由基礎層、技術層與應用層構成。同樣,智能語音識別亦由這三層組成,本文從語音識別的商業化應用出發,並探討驅動語音識別發展的算法及硬體計算能力,三位一體淺析語音識別現狀、發展趨勢及仍然面臨的難點。
  • 智能語音識別技術入門系列(上)
    本系列文章開始,我們將一起探索自動識別、語言處理技術所包含的核心算法、模型及未來的發展趨勢。本篇文章我們主要討論語音識別的基本概念。並理解語音識別技術的流程。(一) 自動語音識別技術ASR自動語音識別,簡稱ASR。這項技術是使人與人,人與機器更順暢交流的關鍵技術。
  • 語音識別算法有哪些_語音識別特徵提取方法
    語音識別算法有哪些_語音識別特徵提取方法 網絡整理 發表於 2020-04-01 09:24:49   語音識別算法有哪些   本文列舉了幾種不同的語音識別算法
  • 輸入法的未來:語音交互成主流,隔空操作或是常態
    i奇趣兒的觀點如下:語音輸入或成為主流,垂直輸入法會受到追捧,手勢輸入頻率會越來越高。除了手機、PC和平板電腦,會有更多的智能硬體設備搭載輸入法。i奇趣兒認為,這種變化趨勢一直都存在。輸入法最開始只是一種打字工具,你在鍵盤上按下「A」鍵,屏幕就會顯現對應的字符,僅此而已。
  • 人工智慧的未來趨勢
    下面人工智慧網小編帶領大家一起來了解一下人工智慧以及人工智慧的未來趨勢人工智慧是什麼?人工智慧(Artificial Intelligence)是研究、開發用於模擬、延伸和擴展人智能的理論、方法、技術及應用系統的一門新技術科學。
  • 搜狗奪食科大訊飛語音識別
    在語音識別領域,代表語音技術圈領先水平的INTERSPEECH為促進語音識別技術的進步,舉辦了2020屆語音識別挑戰賽。在今年舉辦的INTERSPEECH 2020 DNS挑戰賽中,搜狗以4.01的MOS評分奪得冠軍。AI降噪技術取得的喜人成績,讓搜狗在語音識別技術的商業化推進中有了更足的底氣。
  • SoapBox Lab開發兒童語音識別技術,打造最懂孩子的語音助手
    開發兒童語音識別軟體,創建獨特的兒童語音數據集,對於兒童語音和行為模式的理解互相結合,專屬的算法能隨時識別出兒童的語音,保護兒童的安全。近日,極客爸爸了解到,語音識別研究過程中會發現成人建立的語音庫並不能很好地理解兒童語音,很多存在著識別錯誤的問題。
  • 2012年9月SoundHound用戶數突破1億
    音樂識別服務SoundHound可以讓用戶通過哼唱來搜索音樂,近日宣布用戶量已超過一億大關。也就是說繼上次六月更新5.0版並突破8000萬用戶數之後,三個月的時間裡SoundHound又積累了2000萬用戶,每日的平均新增用戶超過20萬,峰值達到驚人的一百萬。那麼究竟是什麼原因讓一款「找歌名」的應用增速如此火爆呢?
  • 【活動】三大因素促進智能語音爆發 未來能讀懂人的喜怒哀樂
    在此期間,京東智能在深圳京東JD+智能奶茶館舉辦了 「遇見未來——智能語音應用的裂變」主題分享活動。會上,靈隆科技有限公司總經理魏強、科大訊飛高級產品經理鄒雲貴、迪韻科技聯合創始人兼CTO彭遠疆,以及智東西聯合創始人總編輯張國仁,就「智能語音未來—泛科技領域構建」為話題在圓桌論壇環節展開了深入探討。
  • 英語啟蒙|如何培養孩子的語音意識和音素意識?
    要回答這個問題,我們需要了解:l 什麼是語音意識?l 培養語音意識的方法有哪些?l 什麼是音素意識?l 培養音素意識的方法有哪些?1. 什麼是語音意識?音素意識,是指把單詞內部單個音素拆分並重組的能力;而音素(phoneme)是根據語音的自然屬性劃分出來的最小語音單位,即英語單詞中的最小發音單位。
  • 賈磊暢談AI語音技術的現在、過去和未來
    在2020魔幻的一年,智能語音技術的最新發展是什麼?伴隨著5G、AI算力等技術的快速發展,未來智能語音技術又將在哪些方向進行突破和創新?本文將分為上下兩部分,結合賈磊的從業經歷,從個人側和技術側詳談智能語音技術的過去、現在和未來,肯定能讓你收穫頗多。另外,賈磊也將於2021年1月8-9日QCon北京站上帶來智能語音的更多精彩分享,歡迎大家現場面基,共同探討、交流。
  • AI浪潮下,語音識別建模技術的演進 | 雷鋒網公開課
    語音識別建模對語音識別來說是不可或缺的一部分,因為不同的建模技術通常意味著不同的識別性能,所以這是各個語音識別團隊重點優化的方向。本期硬創公開課邀請到了搜狗語音交互中心語音技術部負責人陳偉來為大家分享伴隨著本輪人工智慧浪潮下語音識別建模技術的演進,希望能夠幫大家理清主流的識別建模脈絡以及背後的思考。