在我們的印象中,機器人說話就應該有個機器人的樣子,目光呆滯、手足並用、金屬質感十足的遲鈍語調才是機器人的發音常態。但是Cortana卻叛變了,她說話根本不像機器人,反而像極了正常人類,那麼她是如何做到的呢?
會說人話因為咱有語氣
這首先要先知道我們人類是怎麼發音的。在每個詞彙中,都會包含有大量的基礎音,這點在我們最初學英語時已經有過很多的親身體驗。而這些基礎音疊加在一起就會構成我們所說的複雜的語言。
Cortana的語言比我們更複雜
機器人能說話其實利用的便是這一原理。將這些基礎音從語言樣本中一一提取解析出來,然後打碎重新組合,形成新的目標的語言。這一過程我們可以考慮祖宗的活字印刷,只不過是活字變成了基礎音。
Cortana的母語是英語,說英語的難度要小很多。在接收到語言文本以後,Cortana需要先利用計算語義學等邏輯對其進行分析,得知其語義。然後利用合成信號處理等將其解析出人聲基礎音。這樣就可以發出一些簡單的英文對話了。
讓Cortana說中文,難度更大
那麼問題來了,如果Cortana接收到的其他語種呢?我們中國用的可是漢語,Cortana也能說中國話,這是為什麼呢?道理其實是類似的,Cortana會將一些英文的語義進行翻譯,轉換為中文,然後再以中文的基礎音進行分析構建。
而如果Cortana遇到的新的問題,比如語音基礎缺乏等問題,這時人工智慧的力量就要發揮了。利用雲端的匹配搜索,Cortana可以尋找相近的基礎音進行取代和體會,當然有時這也並不足以解決問題,那就需要用到真人進行配音了。
強大的微軟雲給Cortana注入新動力
而在這個過程中,雲技術會起到很大的影響,比如雲存儲、大規模計算和響應等多方面問題。但是這依然沒有解決一個很重要的問題,很多機器人說話用的都是這個原理。那為什麼Cortana說話會沒有機器人味兒呢?
在這點Cortana表現的十分機智。Cortana會根據當前的對話情景進行情感分析,分析所採用的原理依然是萬能的機器學習。然後利用當前情景的情感因素控制自己的語音和語調,也就會產生相應的語氣。
Cortana也有小情緒
這點相信各位用戶在使用過程中會有一定體驗,比如Cortana道歉或者抱歉時,會選擇很謙遜的語氣,在回答你的問題時會採用很堅定的語氣。這樣語氣的加入會使得原本冷冰冰的單詞拼接變得更像人類的發音,這也是Cortana不同於其他機器人的地方。
不講道理講科研
當然,Cortana的競爭對手Siri 和Google Now也會採用這些技術。但是很多用戶表示,還是Cortana的擬人程度會更高一些,這點的原因就不在Cortana身上了,而是在於其背後的微軟研究院。
Cortana的比Siri說話更像人
微軟研究院是一個怎樣強大的存在,如果你有所了解一定會為其所震驚。微軟作為世界上最強大的科技公司之一,微軟研究院可謂是其最大創新依託。微軟研究院與其他公司的創新中心不同,這裡完全是一個學院派的作風。
如果談到論文發表,你可能會想到各種高等院校,但是你知道嗎?微軟研究院所發表的論文數量一度排名全球第一,甚至超過最著名的麻省理工等高校。而微軟研究院的甚至還會做出出版教材這種純學術性事件。
更像科研機構的微軟研究院
更為奇葩的一點,其他公司的創新中心員工的考核往往以績效作為考核的標準,而微軟研究院則是以論文發表的情況為考核標準。這根本就是個超級大學啊!微軟研究院以這種類似科研機構的專業精神所打造的產品有著更好的表現也就不太奇怪了。
Cortana「叛變」了機器人語音,改成好好說人話。這絕不僅僅是技術上的小動作,其背後強大的科研支持才是Cortana越來越好的根源所在。而在這一點上,我國的科技巨頭則需要更多的努力啦。