開發兒童語音識別軟體,創建獨特的兒童語音數據集,對於兒童語音和行為模式的理解互相結合,專屬的算法能隨時識別出兒童的語音,保護兒童的安全。
近日,極客爸爸了解到,語音識別研究過程中會發現成人建立的語音庫並不能很好地理解兒童語音,很多存在著識別錯誤的問題。為解決這種尷尬的情況,愛爾蘭初創公司SoapBox Lab致力於「為孩童創造世界上最精準的語音識別技術」。
SoapBox Lab成立於2013年,創始人是Bell Lab研究院的Patricia Scanlon博士,其有著將近20年的語音識別領域的研究經驗。
SoapBox Labs非常專注地做兒童語音識別,致力創建「世界上最精準的兒童語義理解知識庫」,讓人工智慧更準確的識別兒童語音,理解兒童語音。並計劃向那些支持語音交互的教學APP、智能硬體、物聯網設備以及AR/VR設備提供能第三方技術接口。
之所以強調兒童語音識別是因為相對於成年人,兒童說話時聲音尖細、聲帶振動快、頻率高且發音比成年人模糊,所以亞馬遜Echo和谷歌助手等應用了通用語音識別技術的產品在與兒童交互時錯誤率高,用戶體驗糟糕,而兒童佔全世界總人口的25%還多,如此大的市場卻沒有巨頭躋身其間,投身其中還有政府扶持,何樂而不為呢?
在思考這個問題時SoapBox Labs創始人兼執行長Patricia Scanlon正在諾基亞貝爾實驗室擔任研究員,而在更早之前則在IBM Wason研究中心做有關自然語言處理的博士後研究。
2013年4月她從諾基亞貝爾實驗室辭職,次月就成立這家新公司,其後4年多時間先後與母校都柏林大學、愛爾蘭政府發起的科研機構Learnovate建立起和合作關係,研究兒童的語言和行為模式並收集了數千小時的兒童語音數據集來分析4-12歲群體的語音波形特徵。
期間,她還從另一家自然語言處理技術研發商Kasisto挖來了諾基亞貝爾實驗室的前同事Qiru Zhou任首席科學家,研發適用於兒童遊戲、電子教育所用的機器學習語音模型。
SoapBox Labs構建的獨有的兒童語音數據集,目前已有數千小時的兒童語音數據組成,並將其團隊對兒童語音和行為模式的理解相互結合。
SoapBox Labs 正在利用這套深度學習的算法與從事兒童教育的初創公司合作,共同開發,前者提供算法,後者提供數據源。
SoapBox Labs 目前已經發布了一個供第三方使用的英語兒童語音識別API,此外,公司還披露了最新的融資進展 —— 210萬歐元,包括150萬歐元的歐盟贈款與60萬歐元的股權投資。截止今日,SoapBox Labs 共獲得超過300萬歐元的資金。
談及兒童語音識別軟體的未來,Scanlon表示:她相信不久的將來,設備將能夠分辨兒童與成人,並以此調節數據集和識別模型。
她說,儘管兒童語音識別技術開發很困難,但是一旦成功了,那麼成人使用起來也能夠完美適配。只不過目前,將幼兒從成人語音識別裡剝離出來的解決方案會更合適一些。
除此之外,如果設備清楚自己在同兒童交互,那麼就可以更改行為模式或交互規則。畢竟,在一些特定情況下,你是不想讓兒童為所欲為的。