原標題:譜寫智能語音和諧樂曲
不久前,中科院聲學所研究員顏永紅帶領團隊,為其實驗室——中科院語言聲學與內容理解重點實驗室(原名中科院聲學所中科信利語音實驗室)舉行了13周年慶典。
而就在最近,他們又增加了一個慶祝的理由:該實驗室和中科院新疆理化所合作開展的「基於海雲計算的智能語音處理系統」獲得2014年度中科院傑出科技成就獎。
這是該實驗室在智能語音領域結出的又一枚碩果。
「老」研究上的新突破
此次獲獎的「基於海雲計算的智能語音處理系統」項目,是顏永紅團隊在智能語音領域多年成果的延續。
他告訴記者,該課題於2008年立項。當時,恰逢中科院副院長陰和俊正在謀劃為新疆做點事。為響應號召,顏永紅課題組便與新疆理化所合作開展該項目。
如今,「雙語教學輔助軟體」成為該系統最為人熟知的應用。同時,「基於海雲計算的智能語音處理系統」還被用於國家安全領域。
「現在『雙語教學』軟體已經很成熟,課題也在2014年告一段落。」顏永紅說,「但這只是理論上的結束,我們的研究工作還在進一步深入。」
在顏永紅看來,「基於海雲計算的智能語音處理系統」不是單一課題,而是許多研究內容的結合。「這是在多年智能語音系統研究基礎上取得的新突破。」
「沒有大的團隊,做不了大的事情」
短短13年,中科院語言聲學與內容理解重點實驗室已成為世界上最先進的智能語音實驗室之一。「沒有什麼捷徑,我們是一點一點靠競爭活下來的。」顏永紅說。
此次獲獎項目的主要完成者之一張鵬遠,在2004年到聲學所攻讀博士學位,並成為顏永紅的學生。如今已是副研究員的他向記者回憶說:「我剛來時,實驗室也不過十幾個人,在一層的小房間裡。但實驗室會抓住每個項目鍛鍊大家。我記憶特別深刻的是,有一次接到北航的項目,有10萬元,那時候絕對是大手筆,大家都下決心要好好完成。」
令顏永紅自豪的另一件事情是,不同於其他實驗室一個課題組一個帳本,語言聲學與內容理解重點實驗室自成立之初便是一個集體、一個帳本。「我們實驗室有90多位工作人員、40多名學生。這麼大的實驗室,到現在也只有一個帳本。」在顏永紅看來,沒有大的團隊,做不了大的事情。
在這樣的理念下,顏永紅帶領著「大團隊」在智能語音領域摘得一個又一個果實:2004年,研發出國內第一款手機語音助手;2006年,開發出國內第一個電信級語音識別引擎;2007年,在步步高、諾亞舟學習機中應用中國第一款語音發音評估矯正軟體;2009年,研發出國內第一個語音雲,並將其應用於百度語音搜索;2010年,在即時通訊領域開發大規模語音輸入,並在騰訊QQ中應用;2013年,研發出中國第一款智能語音客服系統,應用於阿里巴巴……
因為興趣的堅持
如今,智能語音行業炙手可熱,研究院所面臨著企業來「挖人」的現象。顏永紅和他的團隊也不例外。
顏永紅的學生、此次獲獎項目的主要完成者之一張晴晴告訴記者,如今她和張鵬遠帶的一些學生一畢業便會被大公司挖走。
另一位課題主要完成者、2009年通過中科院海外引進人才來到聲學所的周若華也表示,雖然與中科院其他研究所相比,實驗室的待遇並不算差,但和大公司還是有很大差距。「所以,留下來堅持作研究的都是真的喜歡這個領域,是因為興趣。」
留下作研究就要面臨做科研的困難。「做科研,晚上加班是家常便飯。」顏永紅說,「我們實驗室一周七天經常燈火通明。當然,為課題作必要的付出是常有的事。」
2008年從北大本科畢業來到聲學所碩博連讀的李鑫,一到聲學所便參與到「基於海雲計算的智能語音處理系統」課題中。為了「雙語教學」軟體的開發,李鑫從2008年開始自學維語發音。
正是在興趣的驅動下,團隊成員在智能語音領域取得了豐碩的成果。
如今,顏永紅和他的團隊除了開展國家相關課題,還積極參與民用智能語音的應用工作。「我們基本上每年做一個新產品,一定是最前沿的技術和引領性的應用。」顏永紅認為,在多媒體時代,智能語音處理技術前景大好,但這些技術在民用市場的應用還不夠廣。「原因有兩個:一是智能語音處理技術計算量太大,使用成本還相對較高;二是該項技術還沒有足夠好。因此,智能語音在民用市場的普及還需要一段時間。」(王俊寧)