SoapBox Lab開發兒童語音識別技術,打造最懂孩子的語音助手

2021-01-07 極客爸爸

開發兒童語音識別軟體,創建獨特的兒童語音數據集,對於兒童語音和行為模式的理解互相結合,專屬的算法能隨時識別出兒童的語音,保護兒童的安全。

近日,極客爸爸了解到,語音識別研究過程中會發現成人建立的語音庫並不能很好地理解兒童語音,很多存在著識別錯誤的問題。為解決這種尷尬的情況,愛爾蘭初創公司SoapBox Lab致力於「為孩童創造世界上最精準的語音識別技術」。

SoapBox Lab成立於2013年,創始人是Bell Lab研究院的Patricia Scanlon博士,其有著將近20年的語音識別領域的研究經驗。

SoapBox Labs非常專注地做兒童語音識別,致力創建「世界上最精準的兒童語義理解知識庫」,讓人工智慧更準確的識別兒童語音,理解兒童語音。並計劃向那些支持語音交互的教學APP、智能硬體、物聯網設備以及AR/VR設備提供能第三方技術接口。

之所以強調兒童語音識別是因為相對於成年人,兒童說話時聲音尖細、聲帶振動快、頻率高且發音比成年人模糊,所以亞馬遜Echo和谷歌助手等應用了通用語音識別技術的產品在與兒童交互時錯誤率高,用戶體驗糟糕,而兒童佔全世界總人口的25%還多,如此大的市場卻沒有巨頭躋身其間,投身其中還有政府扶持,何樂而不為呢?

在思考這個問題時SoapBox Labs創始人兼執行長Patricia Scanlon正在諾基亞貝爾實驗室擔任研究員,而在更早之前則在IBM Wason研究中心做有關自然語言處理的博士後研究。

2013年4月她從諾基亞貝爾實驗室辭職,次月就成立這家新公司,其後4年多時間先後與母校都柏林大學、愛爾蘭政府發起的科研機構Learnovate建立起和合作關係,研究兒童的語言和行為模式並收集了數千小時的兒童語音數據集來分析4-12歲群體的語音波形特徵。

期間,她還從另一家自然語言處理技術研發商Kasisto挖來了諾基亞貝爾實驗室的前同事Qiru Zhou任首席科學家,研發適用於兒童遊戲、電子教育所用的機器學習語音模型。

SoapBox Labs構建的獨有的兒童語音數據集,目前已有數千小時的兒童語音數據組成,並將其團隊對兒童語音和行為模式的理解相互結合。

SoapBox Labs 正在利用這套深度學習的算法與從事兒童教育的初創公司合作,共同開發,前者提供算法,後者提供數據源。

SoapBox Labs 目前已經發布了一個供第三方使用的英語兒童語音識別API,此外,公司還披露了最新的融資進展 —— 210萬歐元,包括150萬歐元的歐盟贈款與60萬歐元的股權投資。截止今日,SoapBox Labs 共獲得超過300萬歐元的資金。

談及兒童語音識別軟體的未來,Scanlon表示:她相信不久的將來,設備將能夠分辨兒童與成人,並以此調節數據集和識別模型。

她說,儘管兒童語音識別技術開發很困難,但是一旦成功了,那麼成人使用起來也能夠完美適配。只不過目前,將幼兒從成人語音識別裡剝離出來的解決方案會更合適一些。

除此之外,如果設備清楚自己在同兒童交互,那麼就可以更改行為模式或交互規則。畢竟,在一些特定情況下,你是不想讓兒童為所欲為的。

相關焦點

  • 為兒童建立專有語音識別算法,「SoapBox Labs」想成為最懂孩子的...
    愛爾蘭初創公司 SoapBox Labs 的願景是創建「世界上最精準的兒童語義理解知識庫」,並計劃向那些支持語音交互的教學APP、智能硬體、物聯網設備以及AR/VR設備提供能第三方技術接口。之所以發生這類問題,除了孩子具備更高的音階以及不同的言語模式外,更為重要的是,與成年人不同,孩子並不擅長按照機器能理解的方式與其交互,無論是我們有意識地還是無意識地為了採用了更有好的交互界面抑或是更加智能的語音助理。
  • 愛爾蘭兒童語音識別技術開發商SoapBox Labs獲650萬美元A輪融資
    圖源:SoapBox Labs芥末堆4月22日訊,近日,愛爾蘭語音識別技術開發商SoapBox Labs獲得650萬美元A輪融資,Elkstone Capital、Astia和一些私人投資者參與此次投資。
  • 語音識別開源工具PyTorch-Kaldi:兼顧Kaldi效率與PyTorch靈活性
    機器之心原創作者:Nurhachu Null本文主要介紹用於語音識別的開源工具——PyTorch-Kaldi。1 背景傑出的科學家和工程師們一直在努力地給機器賦予自然交流的能力,語音識別就是其中的一個重要環節。人類對語音識別技術的研究從上世紀 50 年代開始就未曾停止。
  • 語音識別技術簡史
    由於語音交互提供了更自然、更便利、更高效的溝通形式,語音必定將成為未來最主要的人機互動接口之一。當然,當前技術還存在很多不足,如對於強噪聲、超遠場、強幹擾、多語種、大詞彙等場景下的語音識別還需要很大的提升;另外,多人語音識別和離線語音識別也是當前需要重點解決的問題。雖然語音識別還無法做到無限制領域、無限制人群的應用,但是至少從應用實踐中我們看到了一些希望。
  • 智能助手推動語音革命
    sX1ednc語音助手「對話」反應遲鈍與其底層技術的諸多方面有關。語音識別和響應所採用的算法要佔用大量處理能力,因此,如今的智慧型手機和智能音箱系統是將錄音發送至雲端計算資源。為了儘可能縮短傳輸時延,系統通常傳輸低質量音頻文件,這會導致較高的錯誤率。而網際網路本身是一種變速媒介,所以傳輸速度是變化不定的。
  • 愛爾蘭語音技術領風騷,科技公司SoapBox Labs獲巨額投資
    近日,一家為兒童提供語音識別技術的愛爾蘭科技公司SoapBox Labs獲得了580萬歐元的投資,使其迄今已獲得的總投資達到1020萬歐元。該公司打算在花了多年時間開發開創性技術後,用這筆錢來大幅擴大公司規模。
  • 小米的語音助手小愛同學為什麼能夠脫穎而出
    小米的語音助手小愛同學為什麼能夠脫穎而出?目前,在國內主流安卓手機廠商中,小米的語音助手小愛同學做的是比較好的,我認為原因有以下兩個主要方面。小米在IOT布局的前期主要以手機作為智能家居(米家)的控制核心,現在看來米家的控制中心慢慢的已經轉向小米語音助手小愛同學了,小愛同學作為米家的控制中心,地位是非常高,不能太笨,因為小愛同學的智能程度一定程度上決定智能家居的智能程度,所以小米在語音助手的重視度上就比其他廠商要高。
  • 小米、錘子們都在談手機語音助手,它的春天來了?-虎嗅網
    據vivo的一名負責人透露,他們正跟百度DuerOS合作來打造車載場景下的語音交互。第二類是一些成熟的語音技術廠商,比如像Nuance、科大訊飛、搜狗知音等。在早期,蘋果、三星等都使用Nuance的語音識別技術,但是隨著深度學習技術的成熟,以及各家對語音技術的重視都走上了自研的道路。
  • 百度景鯤:智能語音助手的下一步,是「破圈」
    魚羊 發自 中關村軟體園量子位 報導 | 公眾號 QbitAI「智能語音助手,已經站到了下一次爆發式增長的前期。」雖然以往的小度智能音箱產品中早已上線兒童模式,但景鯤談到,相比於老年人群體,兒童的需求跟成人的差異化更大、更多,導致通用的產品在兒童教育等方面,並不能很好地滿足需求。這就需要有針對性地去做產品設計、技術強化。
  • 榮耀智慧屏X1語音助手體驗:YOYO正在幹掉遙控器
    簡單的按鍵就能解決全部需求,但即使如此榮耀也並未滿足,工程師希望通過語音的方式讓人們儘可能忘記遙控器。榮耀智慧屏X1的語音喚醒並不需要提前錄入用戶的聲音,這點與手機語音助手是不同的。只需要說出「你好 YOYO」就能啟動,隨後說出想要觀看的內容即可搜索。以筆者有娃的家庭為例,小孩子喜歡在不同的動畫片中反覆切換看。
  • 調用手機語音助手 i-Mode車載系統體驗
    ● 哪些導航可實現語音控制  語音操控功能的實現並不難,目前後市場比較常見的做法是兩種,一種是開發語音系統功能,用於比較簡單的操控(只有限定內的語音指令),其弊端是車主在操控時,需要說出明確指令,這種系統識別,
  • 鎂佳科技CEO莊莉:從語音助手到全場景語音引擎
    非常高興在億歐世界創新年會與大家分享我們在「軟體定義汽車」時代下,在車載語音方面的實踐。車載語音是在「軟體定義汽車」時代非常重要的交互手段。首先我們可以去回想過去幾年在車內經常用到的語音助手。語音助手通常從集成包來講,其調試非常的不方便,因為集成的東西比較多,所以更新迭代的過程很複雜,為一輛車做個性化語音定製非常困難。
  • 智能語音識別技術入門系列(上)
    本系列文章開始,我們將一起探索自動識別、語言處理技術所包含的核心算法、模型及未來的發展趨勢。本篇文章我們主要討論語音識別的基本概念。並理解語音識別技術的流程。(一) 自動語音識別技術ASR自動語音識別,簡稱ASR。這項技術是使人與人,人與機器更順暢交流的關鍵技術。
  • 從不溫不火到炙手可熱:語音識別技術簡史
    由於語音交互提供了更自然、更便利、更高效的溝通形式,語音必定將成為未來最主要的人機互動接口之一。當然,當前技術還存在很多不足,如對於強噪聲、超遠場、強幹擾、多語種、大詞彙等場景下的語音識別還需要很大的提升;另外,多人語音識別和離線語音識別也是當前需要重點解決的問題。雖然語音識別還無法做到無限制領域、無限制人群的應用,但是至少從應用實踐中我們看到了一些希望。
  • 惠小微智能語音助手加持 讓電腦更懂你
    隨著人工智慧和語音識別技術的不斷發展,我們的工作和生活也變得更加智能和便利, 比如,強大的語音識別助手就可以解放我們的雙手,動動嘴就能完成各種操作。星14高性能輕薄本內置了惠小微智能語音助手,能快速幫助主人通過語音指令來完成任務,包括報時、設置提醒、音樂播放、查詢天氣等。那麼這些功能具體是如何實現的呢,我們一起來看惠小微智能語音助手的實戰場景。小雪是標準的95後女生,喜歡嘗試新穎且具有高顏值的電子產品。
  • 靈犀語音助手蘋果版下載_靈犀語音助手iOS版免費下載-太平洋下載中心
    靈犀語音助手 學習辦公 大小: 235.4 MB
  • 專注E2E語音識別,騰訊AILab開源語音處理工具包PIKA
    機器之心報導作者:魔王、杜偉PyTorch + Kaldi,騰訊 AI Lab 開源輕量級語音處理工具包 PIKA,專注於端到端語音識別任務。Kaldi 是一個開源的語音識別系統,由 Daniel Povey 主導開發,在很多語音識別測試和應用中廣泛使用。
  • 應用、算法、晶片,「三位一體」淺析語音識別
    一、應用智能語音技術是人工智慧應用最成熟的技術之一,並擁有交互的自然性,因而,其具有巨大的市場空間。中國語音產業聯盟《2015中國智能語音產業發展白皮書》數據顯示,2017年全球智能語音產業規模將首次超過百億美元,達到105億美元。中國2017年智能語音產業規模也將首次突破百億元,五年複合增長率超過60%。
  • 「語音生活助手」哪家強?獵雲網評測告訴你答案
    當然,前幾年,對著手機、智能音箱等硬體產品語音對話時,語義理解錯誤、對話困難、流暢性差等體驗讓很多人對於語音助手望而卻步。而現在,隨著以NLP語義理解為代表的語音技術日益發展,語音助手已經逐漸褪掉「智障」的稱號,開始真正走向智能。用語音對話處理生活上的問題,逐漸成為可能,甚至越來越多的人將語音助手看作是一種陪伴。
  • 語音識別功能常見問題及解決方法
    親愛的車主朋友們,大家都知道我們的愛車有著語音識別技術這一強大實用的功能。在日常用車時,我們都知道如何喚醒並使用,但有時候部分車主會發現語音識別效果並沒有達到預期狀態,感覺愛車無法準確理解我們的喚醒需求,這是為什麼呢?小編總結了一些在使用語音識別功能中遇到的常見問題及解決方法,我們一起來了解一下吧!