最適合計算機的聲音,應該是什麼樣的?

2020-12-05 雷鋒網

計算機與人類對話時，什麼樣的聲音聽起來最合適？

這是2009年六個IBM語言學家，工程師和營銷人員面臨的問題。當時他們想為公司的人工智慧程序Watson將文本轉換為語音。18個月後，一種精心製作的語音誕生，它聽起來沒那麼人性化，也不像電影《2001太空漫遊》中的HAL 9000那麼冰冷。

為計算機賦予「個性」是很多軟體設計師在做的事，隨著行動裝置的普及，人類的手和眼已經忙不過來，急需語音交互。

除了計算機和手機，還有很多機器也在學習聆聽，理解和說話。汽車與玩具也加入了語音功能，甚至一些新式「家電」也如此，比如家庭陪伴機器人Pepper和Jibo，以及亞馬遜的語音設備Echo。在開發可理解自然語言並回應人類語音命令的軟體（通常被稱為「會話代理」）過程中，還誕生了新的設計科學——人機互動設計，但其藝術性往往要強於科學性。

不過，即使是用於天氣預報和交通導航的簡單語句，也很難讓計算機聲音能與人類的一模一樣。多數軟體設計師承認，語音設計還沒達到「恐怖谷」的程度。而除了正確的發音，更大的挑戰是賦予計算機語調和情緒，即韻律。要讓人工智慧完全展現人類說話中的豐富情緒，這在現在還是不可能的事。

合成語音的生成方式有好幾種。效果最好的技術會使用人類語音，從中生成不同說話方式的資料庫。每個資料庫都需要人類配音者錄製數十至上百小時。為計算機語音加入情緒的重要性和困難，在電影《她》中體現的最為淋漓盡致。劇中男主角愛上了人工智慧Samantha，而他們就是通過語音交流的。

電影《她》劇照

現代語音合成技術的奠基人是蘇格蘭計算機科學家Alan Black，他現在是卡內基梅隆大學語言技術研究所的教授。他認為在巨大進步的背後，語音合成系統還不能像人類那樣完美，它們不能「帶著感情說話」。

對一些玩具產品公司來說，語音系統的不完善不算重要，因為其產品就是用於娛樂和取悅用戶的。但對那些用於與人類合作，會成為工作夥伴的系統來說，這一困難還是無法超越。

IBM最近公布了一段電視廣告，其中有作曲家鮑勃·迪倫和Watson的出鏡。廣告中當Watson開始唱歌時，鮑勃·迪倫驟然退場，因為人工智慧程序的聲音實在太難聽了。不過IBM的目標就是讓系統成為不那麼人類的專家，他們想要的聲音不需要太像人類，也不能太恐怖。

不過IBM研究院的研究員Andy Aaron表示，即使是正確讀出一個單詞，「出錯率依然是我們最大的挑戰」。團隊中的一些成員花了一年多時間創建了一個龐大的正確發音資料庫，以讓錯誤儘可能接近零。

IBM還聘用了25名配音員，尋找特別的人類聲音，並以此為基礎為Watson開發語音。在選出最想要的聲音後，IBM用多種方式進行了調整，甚至會提升頻率，讓聲音聽起來像小孩。不過這種個性的聲音遭到了一致反對。

他們想要的聲音要緩慢，平穩而且「令人愉悅」，整個過程讓工程師的工作看起來更像藝術家。最終他們生成的語音雖然一聽就知道是計算機，但透露出了樂觀，還有一點活潑。

隨著語音技術的進步，它的應用範圍也會越來越廣。以色列公司Imperson之前都在開發娛樂型的對話角色，現在卻在考慮往政治方向發展，比如在社交平臺上讓虛擬的競選者與民眾互動，即使知道是假的，單獨與政治人物對話也會產生親切感吧。

via nytimes

雷鋒網原創文章，未經授權禁止轉載。詳情見轉載須知。

相關焦點

什麼樣的樹最適合當「聖誕樹」

聖誕樹作為聖誕節期間，慶祝中最有名的傳統擺設之一。通常人們在聖誕前後把一棵常綠植物弄進屋裡或者在戶外，並用聖誕燈和彩色的裝飾物裝飾，把一個天使或星星放在樹的頂上。那你知道什麼樣的樹才適合用來當聖誕樹嗎？其實要當聖誕樹，必須要滿足這樣幾個條件：松柏類、常綠、樹形要呈現三角形。滿足了這些條件的樹木，都可以作為「聖誕樹」來使用。
日本:量子計算機可研製出「最適合您的化妝品」

量子計算機是通過支配電子和原子等眼睛看不見的「量子」世界的獨特物理法則(量子力學)來進行計算的計算機。與普通計算機相比，量子計算機能夠並列進行大量運算，因而可以在極短的時間內得到答案。尤其擅長從幾個龐大的數字選項中導出條件相符的答案。
什麼樣的位置最適合

每一對新人拿到自己拍好的婚紗照，都會想怎麼用它來布置新婚的婚房，很多人都會想，是不是掛在床頭才是最好的，進房就能看到碩大的照片，但是，其實婚紗照這個東西，是不可隨意擺放的，這影響著一家的整體風水，一旦擺錯位置，很容易造成夫妻不和，將原本新婚的甜蜜變成為一種負擔，所以，今天和大家分享一下，什麼樣的擺放位置是最適合的
計算機科學教給人們什麼樣的思維?

摘要：計算機科學本質上源自數學思維和工程思維。然而，計算思維遠遠不只是為計算機編程，它是抽象的多個層次上的思維，與「讀寫能力」一樣，是人類的基本思維方式。
十年不變下一代雷射印表機應該什麼樣?

80年代，雷射印表機正在進入中國市場，同一時間，聯想漢卡問世，解決了計算機中文漢字輸入的難題，也為後來聯想在印表機市場上的地位奠定了堅實的基礎。進入網際網路時代，支持網絡功能成為印表機的標配，印表機不再是計算機外設，扮演者辦公系統中的網絡輸出終端的角色。
最適合兒童的程式語言 - Python

所以在需要找到Scratch圖形編程到高級語言圖形編程的過渡，Python就是最適合的程式語言。首先讓我們一起聊聊為什麼開始學習Python？對於開展STEAM教育，Scratch圖形編程是最適合的方式之一。低齡的小朋友在接受和掌握一門語言上難度過大，對數理邏輯也是處於認知階段。所以採用圖形動畫和聲音的互動方式的教授學習效果最為合適。Scratch圖形編程體現在簡單的編程邏輯體驗和入門，針對的一般是小學及以下階段的學生。
什麼樣的流量計適合測量氯氣

測量氯氣應該選用什麼樣的流量計呢現在市面上對於測量液體、氣體、蒸汽等介質的質量流量計的款式是多樣化的，什麼工況下的介質流量選用哪款流量計都是有一定選擇標準的，按使用要求選用合適的流量計，不僅能夠提高工作效率，還能夠延長流量計的使用壽命，整體來說就是提高工作效率，節省成本，增加經濟效益
磁場控制聲學材料,還能打造「聲音計算機」

聲音在不同介質傳播時特性不一樣，利用這些特性，科研人員開發出聲學「超級」材料，以更好地引導控制聲音的傳播效果，在具體應用中，可以阻斷聲音的傳播，或者讓聲音以更好地效果穿透材料。但傳統聲學材料的難點在於幾何設計。聲學裝置大多由金屬或硬塑料構成，一旦成型，幾乎不能改動。
我們的大學應該培養什麼樣的人才

原標題：我們的大學應該培養什麼樣的人才當前深化改革的一個重要課題是高等教育體制改革。自2014年起，由清華大學、北京大學和上海市率先發起的中國高等教育綜合體制改革，力爭使一部分中國高校進入世界一流大學的行列。大學改革的關鍵之一，是建立健全人才培養的體系，特別是適合中國發展的人才培養體系。
其實你的臉型早就決定了你適合什麼樣的鼻子

接下來我們就認真分析一下你的臉型應該適合什麼樣子的鼻子。第一我們先看一下臉型分為哪幾種心形臉特點：面部為倒三角形，下頜角小，下巴尖。升級版是錐子臉。適合鼻子類型：精緻的希臘鼻子，水滴鼻，小鼻子。心形的臉的人很佔便宜，屬於百搭臉，配什麼鼻子就塑造什麼風格。方臉特徵：顴骨和下巴更寬，稜角更明顯。
極客晨星:應該從小就為孩子引入編程和計算機思維

任正非接受採訪的時候曾經說過，「把基礎教育提到國家的最高綱領，用最優秀的人培養更優秀的人」「華為除了優秀的「腦袋」一無所有」。在歐美許多國家，都認可編程已經是這個時代必備的素養，就像看書識字一樣重要，所以學校從小就開始培養兒童的編程思維。風靡全球的編程教育到底是什麼?兒童編程指針對高中以下的孩子所設計的編程學習類產品。
用於自動化的嵌入式計算機

工業自動化是利用自動化計算機在工業環境中控制過程、機器人和機械，以製造產品或其部件。工業自動化的目的是提高生產率，增加靈活性，提高製造過程的質量。工業自動化最常見於汽車製造業，在汽車製造業中，許多任務都是通過使用控制機械和過程的自動化PC實現自動化的。
老家的農村,你們是發出什麼樣的聲音讓家養的動物來到你跟前的?

老家的農村，你們是發出什麼樣的聲音讓家養的動物來到你跟前的？下面就摘幾個簡單聊一下：關於喊家雞：我們這邊餵雞時，會發出「啵、啵、啵」或「咕、咕、咕」的聲音，有時候餵食時便敲打食盆邊發出聲響！這樣院裡自由覓食的笨雞就會屁顛顛的衝過來！而之所以會以「咕、咕、咕」喊雞，應該還是參考了家雞平時發出的聲音，另外，民間傳說是因為過去農村小孩叫「姑姑」時，雞就跑過來，後來就成為農戶默認叫法了！
磁性的聲音最具魅力

磁性的聲音最具魅力如果你有一副好聽的嗓音，那麼，你就一定能引起別人的注意，並很可能因此成為討論的主角；如果你沒有一副悅耳動聽的好嗓音，你也要力求使自己的聲音給人以如沐春風之感。那麼，怎樣才能使你的聲音更具有磁性呢？
計算機視覺將用來處理相機圖像

得到一些數據以及判斷,然後推斷應該怎麼工作,這其中包括對人的數據進行分析,包括性別,年齡,籍貫等等,也包括對機器的運算發送指令給人工,使用代碼來進行循環.然後在人工智慧的背後,一個重要的單位就是計算機視覺,它們主要負責識別,分類,檢測,填充,分割.首先計算機視覺可以幫助我們更好的了解自己的眼睛,也就是我們的眼睛,視覺的作用在於生物可以更好的了解周圍的世界。
「最適合男生」的4個專業,工資高、就業率高,簡直人生贏家!

"最適合男生"的4個專業，工資高、就業率高，簡直人生贏家！高中畢業，大學選什麼專業？女孩子、男孩子選擇專業有什麼不同？這是大家都很好奇的問題。男生適合什麼樣的專業？女生又適合什麼樣的呢？下面我們來看看哪些專業是適合男生的呢？土木工程專業各大高校好像都有土木工程這個專業，而且可以說是清一色的男生。很多時候班級黎連一個女生都沒有。但是男生學習土木工程的就業率是非常的高的。不說100%但是就業率也可以高達95%。很多時候畢業以後就直接進公司工作了。
五年後的計算機視覺會是什麼樣?和CV先驅們一同暢想(上) | CVPR 2019

這幾年來，計算機視覺領域的已有問題在研究者們的努力下普遍得到了越來越好的解決，映入大家視野的新問題也越來越多。不過到了 CVPR 這個供全球計算機視覺研究者齊聚討論的盛會上，一個可能不那麼直接指導短期研究、不那麼容易形成共識問題也就自然地湧上了大家的心頭：在五到十年後的未來，計算機視覺的研究會是什麼樣子，是深度學習幾乎完全替代了目前還在使用的其他一些方法，還是我們應該期待新的革命？
什麼樣的人適合老鼠?

兩者的一致意味著他們是和諧的，五行氣場是相融的，適合彼此相處或相處，在一起可以使財富變得更好，這是舊時代婚姻最重要的方面，那麼，什麼樣的十二生肖最適合呢。從中國十二生肖的角度來看，子醜合化土壤和申子辰的組合就是水務局，因此屬於老鼠的人和屬於猴子和龍的人是相容的，婚姻和合作是非常合適的，因為氣場的和諧，生活或事業都會很平靜。
科學家應該是什麼樣的一群人？

科學家到底是一些什麼樣的人？為什麼會有這樣的一個觀點，源於我自己對這樣一個問題的思考：科學家到底是一些什麼樣的人？所以科學家是有國界的，從這一點來說，科學家應該把論文寫在祖國的大地上。但是，科學自有科學自身的規律，科學有一個最重要的特徵，是它必須有糾錯機制。因此科學論文的發表必須是公開的，是向每一個人公開的，而不是局限於哪個國家。
海底一萬米什麼樣？發現神秘生物，不時傳來奇怪聲音

人類對於未知世界的探索從未止步，南極北極和珠峰早就留下了人類的足跡，人類需要「仰望星空」同時也要「探索海底」，那麼深海海底是什麼樣子呢？是世界上最深的海溝，最深處為10994米，誤差可能有幾十米。把喜馬拉雅山倒過來放進去，底部也不會露出了。

最適合計算機的聲音,應該是什麼樣的?

相關焦點

什麼樣的樹最適合當「聖誕樹」

日本:量子計算機可研製出「最適合您的化妝品」

什麼樣的位置最適合

計算機科學教給人們什麼樣的思維?

十年不變 下一代雷射印表機應該什麼樣?

最適合兒童的程式語言 - Python

什麼樣的流量計適合測量氯氣

磁場控制聲學材料,還能打造「聲音計算機」

我們的大學應該培養什麼樣的人才

其實你的臉型早就決定了你適合什麼樣的鼻子

極客晨星:應該從小就為孩子引入編程和計算機思維

用於自動化的嵌入式計算機

老家的農村,你們是發出什麼樣的聲音讓家養的動物來到你跟前的?

磁性的聲音最具魅力

計算機視覺將用來處理相機圖像

「最適合男生」的4個專業,工資高、就業率高,簡直人生贏家!

五年後的計算機視覺會是什麼樣?和CV先驅們一同暢想(上) | CVPR 2019

什麼樣的人適合老鼠?

科學家應該是什麼樣的一群人？

海底一萬米什麼樣？發現神秘生物，不時傳來奇怪聲音

十年不變下一代雷射印表機應該什麼樣?