為兒童建立專有語音識別算法,「SoapBox Labs」想成為最懂孩子的...

2021-01-07 36kr

愛爾蘭初創公司 SoapBox Labs 的願景是創建「世界上最精準的兒童語義理解知識庫」,並計劃向那些支持語音交互的教學APP、智能硬體、物聯網設備以及AR/VR設備提供能第三方技術接口。

SoapBox Labs 由前貝爾實驗室的研究員 Dr. Patricia Scanlon 於2013年創立,她在語音識別與語義理解領域擁有近20年的經驗。

在對語音識別做研究的過程中,Scanlon 發現由成年人建立的語音庫並不能很好的理解兒童的語言,包括在 Amazon Echo 與 Google Home 等設備都出現了在與兒童交互的場景下的識別錯誤的現象。

之所以發生這類問題,除了孩子具備更高的音階以及不同的言語模式外,更為重要的是,與成年人不同,孩子並不擅長按照機器能理解的方式與其交互,無論是我們有意識地還是無意識地為了採用了更有好的交互界面抑或是更加智能的語音助理。

Scanlon在一次電話會議中解釋道,當她和 SoapBox 實驗室團隊在 2013 年開始研究這個問題時,經過廣泛的研究後,很明顯「兒童的言語行為與成年人有很大的不同」,使用成人語音數據開發的語音產品去為兒童服務時,準確率低下的問題一直都無法被解決,所以,團隊決定不得不暫時忘記團隊過去在構建語音識別方面所積累的知識體系。

於是,SoapBox Labs 開始創建自己獨特的兒童語音數據集,目前已有數千小時的兒童語音數據組成,並將其團隊對兒童語音和行為模式的理解相互結合。SoapBox Labs 正在利用這套深度學習的算法與從事兒童教育的初創公司合作,共同開發,前者提供算法,後者提供數據源。

SoapBox Labs 目前已經發布了一個供第三方使用的英語兒童語音識別API,此外,公司還披露了最新的融資進展 —— 210萬歐元,包括150萬歐元的歐盟贈款與60萬歐元的股權投資。截止今日,SoapBox Labs 共獲得超過300萬歐元的資金。


關於兒童語音識別技術的未來,Scanlon表示,未來無論是針對兒童還是針對承認的語音識別都將集成到一個載體內,機器能夠識別說話的主題並根據底層數據模型切換到相應的模式。

相關焦點

  • SoapBox Lab開發兒童語音識別技術,打造最懂孩子的語音助手
    開發兒童語音識別軟體,創建獨特的兒童語音數據集,對於兒童語音和行為模式的理解互相結合,專屬的算法能隨時識別出兒童的語音,保護兒童的安全。近日,極客爸爸了解到,語音識別研究過程中會發現成人建立的語音庫並不能很好地理解兒童語音,很多存在著識別錯誤的問題。
  • 愛爾蘭兒童語音識別技術開發商SoapBox Labs獲650萬美元A輪融資
    圖源:SoapBox Labs芥末堆4月22日訊,近日,愛爾蘭語音識別技術開發商SoapBox Labs獲得650萬美元A輪融資,Elkstone Capital、Astia和一些私人投資者參與此次投資。
  • 語音識別算法有哪些_語音識別特徵提取方法
    語音識別算法有哪些_語音識別特徵提取方法 網絡整理 發表於 2020-04-01 09:24:49   語音識別算法有哪些   本文列舉了幾種不同的語音識別算法
  • 應用、算法、晶片,「三位一體」淺析語音識別
    同樣,智能語音識別亦由這三層組成,本文從語音識別的商業化應用出發,並探討驅動語音識別發展的算法及硬體計算能力,三位一體淺析語音識別現狀、發展趨勢及仍然面臨的難點。一、應用智能語音技術是人工智慧應用最成熟的技術之一,並擁有交互的自然性,因而,其具有巨大的市場空間。
  • 愛爾蘭語音技術領風騷,科技公司SoapBox Labs獲巨額投資
    近日,一家為兒童提供語音識別技術的愛爾蘭科技公司SoapBox Labs獲得了580萬歐元的投資,使其迄今已獲得的總投資達到1020萬歐元。該公司打算在花了多年時間開發開創性技術後,用這筆錢來大幅擴大公司規模。
  • 「口罩識別」後,「頭盔識別」躋身 AI 安防 C 位
    其首席算法專家黃攀告訴雷鋒網AI掘金志,他們已經開發了一套名為AI安全頭盔識別的算法,可以直接平滑升級至絕大部分智能相機中。但這類算法成功上線後,交警部門至少可以做到兩件事:1、手握準確識別結果,交警就有了大量的統計數據,可以藉此數據向上級部門反饋,推行摩託車、電動車的上牌法規立項工作。2、可以準確統計哪些路口、哪些時間段不戴頭盔的現象比較多,可以為現場執法提供依據。
  • 語音識別新範式:完全的「端到端」模型,優勢在哪裡?
    語音識別新範式以自然語言處理的子領域「語音識別」為例,從 2012 年引入深度學習技術開始,語音識別的研究熱點經歷了三個階段:2011年前後,基於 DNN+HMM(深度神經網絡+隱馬爾科夫模型)的語音識別 2014年前後,基於 LSTM+CTC(長短時記憶網絡+連接時序分類)的不完全端到端語音識別
  • 百度景鯤:智能語音助手的下一步,是「破圈」
    魚羊 發自 中關村軟體園量子位 報導 | 公眾號 QbitAI「智能語音助手,已經站到了下一次爆發式增長的前期。」其中兩款均與兒童群體有關:小度教育智能屏和小度智能早教機。因為兒童群體,已然成為智能音箱在家庭場景中非常重要的用戶。這一點,在此前量子位的調研中,也有所體現。
  • 「機器學習」機器學習算法優缺點對比(匯總篇)
    主要回顧下幾個常用算法的適應場景及其優缺點!機器學習算法太多了,分類、回歸、聚類、推薦、圖像識別領域等等,要想找到一個合適算法真的不容易,所以在實際應用中,我們一般都是採用啟發式學習方式來實驗。「優點」:實現簡單,計算簡單;「缺點」:不能擬合非線性數據.最近鄰算法——KNNKNN即最近鄰算法,其主要過程為:1.
  • 為智能音箱加上「眼睛」,天貓精靈用最接地氣的方式做了一次產品升級
    n阿里巴巴人工智慧實驗室負責人 淺雪搭載「火眼」的天貓精靈,在原本的天貓精靈 X1 上增加了一個手機支架,通過把手機連接到天貓精靈 App,手機屏幕出現了一隻可以交互的「天貓」,通過手觸摸,它可以簡單和人互動。這隻「寵物貓」擁有 AI 識圖能力。依靠手機前置攝像頭,天貓精靈有了能「看懂」周圍事物的「眼睛」,它可以識別 2D 和 3D 信息。
  • 將加入小米,語音識別大牛Daniel Povey宣布年底前來中國工作
    Twitter 信息發布後不久,就有人表示想進入小米和這位大牛共事,並問道,「小米收實習生嗎?」「和您共事需要哪些技能?」對此,Povey 回答稱:「我們可能會考慮先僱傭全職員工。一起工作需要的技能不只是 Kaldi,還要有深厚的 C++、Python 功底,而且 Python 方面的知識可能更加重要一些。」此外,帖子底下還有一些列隊歡迎的中國網友。
  • 隨時喚醒語音助手,真不是一句話的事兒
    而在設備處於待機或休眠的超低功耗狀態,或者當設備在播放音樂時,就會自動切換到「闖入模式」,語音數據也會直接傳輸給 AP 晶片,觸發二級喚醒和聲紋驗證,實現低功耗算法中的回聲消除(AEC)。
  • 基於Cyclone II FPGA開發平臺實現語音識別算法程序的設計
    基於Cyclone II FPGA開發平臺實現語音識別算法程序的設計 瀋陽;馮良;洪誠 發表於 2021-01-12 10:21:38 SOPC可編程片上系統是一種獨特的嵌入式微處理系統。
  • 專注E2E語音識別,騰訊AILab開源語音處理工具包PIKA
    機器之心報導作者:魔王、杜偉PyTorch + Kaldi,騰訊 AI Lab 開源輕量級語音處理工具包 PIKA,專注於端到端語音識別任務。Kaldi 是一個開源的語音識別系統,由 Daniel Povey 主導開發,在很多語音識別測試和應用中廣泛使用。
  • 下一個視覺「殺手級應用」來了,依圖行人重識別ReID性能創紀錄
    還記得 2018 年底依圖進軍智能語音,隨即在中文語音識別領域創下識別精度的新紀錄。2019 年 5 月推出全球首顆雲端視覺 AI 晶片,而且「發布即商用」。在一些技術領域中,依圖將行業水平推上了新的高點,並加速了技術的產業化落地。 這背後的關鍵是什麼?
  • SoundHound:語音識別是未來趨勢
    北京時間6月3日消息,據國外媒體報導,據說消費者科技巨頭蘋果準備在其下周的舊金山開發者會 議上推出一個先進的語音功能。如此看來,語音識別技術似乎已經準備好了最終推向大眾消費市場。
  • 智能語音識別技術入門系列(上)
    本系列文章開始,我們將一起探索自動識別、語言處理技術所包含的核心算法、模型及未來的發展趨勢。本篇文章我們主要討論語音識別的基本概念。並理解語音識別技術的流程。(一) 自動語音識別技術ASR自動語音識別,簡稱ASR。這項技術是使人與人,人與機器更順暢交流的關鍵技術。
  • 進軍人臉識別,360 的「安全觀」與「大局觀」
    邱召強介紹,早在 2015 年 5 月,360 就成立了 AI 研究院,從事人臉識別、聲紋 識別、行為識別相關算法的研究。「當時算法為王,鮮有成熟產品,落地應用更是少之又少,市場還處於對 AI 的盲目崇拜,安全被遺忘在角落。」
  • 淺談自然場景中的語音情感識別技術
    語音是人類最基本、最便捷的交流工具,承載了複雜信息的語音信號不僅可以反映語義內容,還能夠傳遞說話人內在的情感狀態。語音情感識別是 建立在對語音信號的產生機制深入研究與分析的基礎上,對語音中反映個人情感信息的一些特徵參數進行提取,並利用這些參數採用相應的模式識別方法確定語音情感狀態的技術。
  • 語音專題第四講,語音識別之解碼器技術簡介|大牛講堂
    博士畢業於中國科學院聲學研究所,曾任聲學所副研究員、百度語音技術部資深工程師等職位。在中科院工作期間曾領導完成多個"863"、教育部和中科院的科研項目。在百度工作期間把解碼器的搜索空間大小壓縮到了原來的十分之一,解碼速度提高了約30%,並在置信度、VAD等方面大幅提高了系統性能。現任地平線機器人語音識別算法工程師,深度參與地平線「安徒生」智能家居平臺的研發。