直接聽,TA是人還是機器

2021-01-14 紅星深度

人類終於正式將聲音賜予了機器!

等下,你說什麼?

人類不是早就有Siri等智能語音助手了麼?

不不

這些智能語音軟體能說人話其實並不算什麼

但若要達到人聲說話的水平

它還遠遠不夠

這也一直是個難題

而如今

谷歌公司在這個問題上

向前邁了一大步

他們研發出了這樣一款系統

其發音說話能高度近似於

人類照著文本念稿的正常說話水平

哇,這麼厲害?!

————————————————————

據美國財經媒體Quartz報導,一周前,谷歌公司發表了一份還未被同行審議的論文,文中詳細介紹了其研發的一款直接從文本中合成語音(Text-to-Speech,TTS)的系統,名為Tacotron 2。據稱,該系統可模仿人類照文本講話,達到高度逼真、和人聲真假難辨的程度。(文末還有聽音測試,歡迎來辨!)

口說無憑,先來一段,讓你一聽為快。

「George Washington was the first President of the United States.」

washington_gen.wav

00:03

來自紅星新聞

怎麼樣,這段由AI機器發出的聲音,是不是已經與人聲無異了?

據科技網站TechCrunch報導,Tacotron 2結合了谷歌此前兩項語音生成技術:WaveNet和初始版的Tacotron,它實際上是兩種深層神經網絡系統的結合。

▲Tacotron2 模型架構的詳細結構。圖中的下半部分描述了將字母序列映射到聲譜的序列到序列模型的結構

Quartz報導稱,第一種網絡系統負責將文本「翻譯」成光譜圖,是用時間來呈現音頻頻率的一種可視化方式。然後,這一光譜圖被輸入WaveNet系統,進而讀取圖表,生成對應的音頻元素。如果你聽說過打敗世界圍棋高手柯潔的阿爾法狗(AlphaGo),那麼你應該知道它背後的團隊就是谷歌母公司Alphabet旗下的AI研究實驗室DeepMind。而WaveNet系統,同樣由DeepMind打造。

● Tacotron 2還能在很多種情況下運行良好,比如可以念出一些複雜詞彙。

● 根據短語語義的不同,它還能有不同的發音。

● 有時,它還可以自動糾正拼寫錯誤。

● 它對標點符號也很敏感。

● 它還能學習如何發重音,以及語調問題。(在培訓過程中,講話者要求大寫字母需要用重音讀出,因此簡單的大寫字母就可以改變整個發音。)

● 當陳述句改為問句時,Tacotron 2也能隨著句式調整語氣。

● 它還能玩轉繞口令。

在論文中,研究人員介紹稱,他們抽取了100個音頻樣本,要求人類聽眾對不同TTS系統生成語言的自然度進行評分。測試結果顯示,Tacotron 2的平均得分達到約4.53,明顯超過其他系統,而且和專業的錄音人員分數(Ground Truth)4.58分極為接近。

▲不同TTS系統生成語言的自然度評分,Tacotron 2得分最高,和專業錄音人員(Ground Truth)的得分極為接近 圖據論文截圖

不過,這個系統也有缺陷。據Quartz報導,該系統目前僅被訓練模仿一名女性的聲音;如果要像男性或不同女性一樣說話,谷歌可能還需要再多加訓練。

興趣測試,歡迎來聽

例子還有許多,下面輪到小測試了。來猜一猜,這些句子哪個是由真人發出,哪個又是由Tacotron 2發出吧。(答案見文末)

視頻加載中...

▲視頻丨聽音測試

「That girl did a video about Star Wars lipstick.」

「She earned a doctorate in sociology at Columbia University.」

「I'm too busy for romance.」

答案

lipstick: 1. AI 2. 真人

Columbia:1. 真人 2. AI

Romance:1. AI 2. 真人

別瞞我,你是不是全都猜錯了?

END

紅星新聞記者丨王雅林 綜合編譯報導

編輯丨汪垠濤

相關焦點

  • 普通獅子座和獅子王的區別,為什麼ta在喜歡的人面前又慫又傲嬌
    有多少人知道,獅子座比較喜歡能夠點燃自己的人,對那些顏值較高,身材姣好的異性往往比較容易產生好感。實際上,判定一個獅子座是小獅子還是王者,往往不能用事業上的成績來衡量,而是看ta面對誘惑的時候,是否能夠堅守自己的本心。顯然,獅子王往往能夠控制自己的欲望,而小獅子則只會活在當下,什麼都想要,最後被欲望所控制,白白地浪費了大好青春,離王者之路越來越遠。
  • 你的每一分忍讓,都是ta得寸進尺的底氣
    雖說在國外,種族平等是政治正確,但是實際上,去國外留學或者工作,或多或少還是會遇到一些種族歧視的事情。很多人遇到這種讓人憤怒的事情時,首先想到的是自己孤身一人在外,忍氣吞聲算了,這也是絕大多數人的做法,但是你忍氣吞聲換來的可能並不是友好相處,更可能是他覺得你慫,你越慫他越看不起你,越變本加厲欺負你。反擊永遠是最有效的對自己的保護。在國外,種族歧視是意見非常嚴重的事情。嚴重到什麼程度?可以引起遊行暴亂的程度,參考去年的弗洛伊德事件。
  • 塔羅牌預言:你與TA是正緣?孽緣?還是無緣?準!
    還是無緣?準!規則:保持內心安靜的狀態,在心中默念問題,從下面四張牌中憑感覺選出一張來,切記不可刻意選擇不可反覆挑選,選好後下翻查看答案。測試結果:A、他是你的正緣哦,或許你自己都清楚,即使還是有一些不滿意的地方,但他已經算是你無法割捨並且已經認可的人了,所以你們的感情還是好好經營吧。B、你就是活潑有活力的人你甚至充滿一種說不出的魅力。你調皮、愛搞笑,喜歡玩樂。
  • 背叛是ta的選擇,療愈是你的功課
    首先,背叛你的人,往往是沒有這份責任心的。背叛一定不是什麼無心之過,背叛者在選擇背叛的時候,對行為的性質和可能導致的結果,其實都是清楚的,背叛當然是對你的一種直接傷害,背叛一定會影響家庭的問題,讓婚姻處於瀕臨破碎的邊緣……關於這些,ta心裡都是清楚的,而ta仍然可以置之不顧,那麼很好地證明了,ta本身對你、對婚姻和家庭就是缺失責任感的。
  • 人眼還是機器「眼」?機器視覺在工業檢測領域大有可為
    【編者按】本文介紹了機器視覺在工業領域的發展歷程,通過其與人類視覺對比,凸顯出機器視覺的優勢。但不可否認的是,機器要做到完全替代人眼,仍有瓶頸需要突破。2、圖像處理和模式識別發展迅速圖像處理上,隨著圖像高精度的邊緣信息的提取,很多原本混合在背景噪聲中難以直接檢測的低對比度瑕疵開始得到分辨。模式識別上,本身可以看作一個標記過程,在一定量度或觀測的基礎上,把待識模式劃分到各自的模式中去。圖像識別中運用得較多的主要是決策理論和結構方法。
  • 英國人喜歡說的「Ta」到底啥意思呢?可不是「它,他,她」啊!
    雖然語言不同,但是有的習慣還是很類似。比如說英語的人,他們也喜歡時不時在說英語的過程中,插入一點外語混合表達。就像咱們說中文的時候,間或也會插入一些英文的表達。比如說很清新脫俗的「Hi,幹嘛呢?」那這一期咱們就說一說英國人的一些「口頭禪」,裡面就有兩個外語單詞哦!1)英國人說的「ta」到底是啥?英國人喜歡說的「Ta」到底啥意思呢? 可不是「它,他,她」啊!Ta means 'thank you'。
  • 人工智慧:人類是高估了自己還是低估了機器的智能?
    還是低估了機器的智能?人工智慧是計算機科學的一個分支,通過研究智能實質,生產出一種能以人類智能相似的方式做出反應的智能機器,包括機器人、語言和圖像識別,自然語言處理系統等。有的人為什麼反對AI的發展?是來源於內心的恐懼,害怕有朝一日智慧機器人會取代人類。《西部世界》正是反映了人類內心對AI的恐懼,機器人有了複雜思維後,反過來想取代人類,儘管是個虛構的故事,但多少能引發我們的反省:當智能科技發展到一定程度時,當我們的生活中,機器人無處不在時,人類該如何重塑社會秩序以保持人類對世界的主導地位?
  • 網絡流行語科普 夜闌臥聽風吹雨,鐵馬是你冰河也是你什麼意思什麼梗?
    網絡流行語科普 夜闌臥聽風吹雨,鐵馬是你冰河也是你什麼意思什麼梗?時間:2019-12-21 15:29   來源:小雞詞典   責任編輯:沫朵 川北在線核心提示:原標題:網絡流行語科普 夜闌臥聽風吹雨,鐵馬是你冰河也是你什麼意思什麼梗?
  • 機器與人,誰更不可靠?——《末日迴旋》
    加拿大科幻影片《HELIX》(中文譯名《末日迴旋》或《螺旋效應》)便從此角度對「機器管理」這項題材進行了挖掘與思考。        影片所展現的未來社會裡,所有人的生理特徵信息,包括掌紋、DNA等,都由一個叫「螺旋」(HELIX)的系統管理,同時,每個人手腕上都嵌入了一道螺旋型標識,系統能夠根據此標識在系統資料庫中方便地查詢到此人的一切信息。
  • 大眾科普_機器也有「感知」嗎?什麼是機器的感知?
    感覺是人腦對作用於人體感官的客觀事物的個別屬性的直接反應;知覺是人腦對作用於感覺器官的客觀事物的整體屬性的認識或解釋。知覺是在感覺的基礎上產生的,是在人的實踐活動中逐漸發展起來的對於直接作用於感官的刺激的認識,二者密不可分,合稱為感知。人體通過各種感覺器官和感覺中樞感知自身信息和環境信息,機器則通過由各種傳感器和信息處理裝置組成的感知系統來感知世界。
  • 單片機與TA8435的步進電機細分控制
    4)速度可在相當寬的範圍內平穩調整,低速下仍能獲得較大轉距,因此一般可以不用減速器而直接驅動負載。 5)步進電機只能通過脈衝電源供電才能運行,不能直接使用交流電源和直流電源。 6)步進電機存在振蕩和失步現象,必須對控制系統和機械負載採取相應措施。
  • 你以為對方與你有緣,其實ta只為騙你「你以為對方與你有緣,其實ta...
    你以為對方與你有緣,其實ta只為騙你「你以為對方與你有緣,其實ta只為騙你「買鞋」… 2020-09-01 18:55 來源:澎湃新聞·澎湃號·政務
  • ta為什麼會莫名其妙地發脾氣
    有些人很容易被天蠍座心裡那種熾熱、鍥而不捨的深情所感動,不喜歡ta的人卻想著逃之夭夭,害怕被天蠍座那種狂熱的愛所波及,如同烈火一般把自己籠罩。 當天蠍座愛一個人,日子過得比較順心的時候,你很難感受到ta身上有什麼壞脾氣,最多是悶不吭聲的樣子。 有多少人知道,天蠍座是一個比較喜歡隱忍的星座,擅長做「臥薪嘗膽」這種事,在ta一個人的時候,這種隱忍的精神往往會用到事業中。
  • Ta是屬於你的正緣還是孽緣呢?
    美好的愛情總是令人憧憬,但很多時候愛情也讓人無奈,明明相愛的兩個人卻沒有一起走下去,這種有緣無份的愛情讓人痛苦卻又無奈。你們是什麼緣分?Ta是屬於你的正緣還是孽緣呢?我們一起用塔羅牌來佔卜看看。B 倒吊人 逆位這張牌說明:你們這段感情中更多的成分,可能是遵循了父母家庭或者是其他人的期望,而不是你真實的內心。目前的你似乎感覺受到拘束,忽然覺醒般地想要自由。緣分善孽各佔一半,因為TA各方面的條件都還好,只是千好萬好,不是你自己真心所選的罷了。選不選、要不要,這點還是全看你自己的選擇了。是這樣嗎?
  • 湖南大學開發出能直接工作於細胞內的DNA分子機器
    新華社長沙1月25日電(記者謝櫻)記者25日從湖南大學獲悉,由湖南大學化學生物傳感與計量學國家重點實驗室、化學化工學院和生物學院共同建設的「分子科學與生物醫學實驗室(MBL實驗室)」譚蔚泓教授研究團隊,開發出一種能直接在細胞內工作的三維DNA分子信號放大器。
  • 《戰爭機器3》多人測試之Checkout地圖介紹
    萬眾期待的《戰爭機器3》在線多人測試Beta即將於4月18日向那些購買了《子彈風暴》EPIC版的用戶們揭開其神秘的面紗,當然這也不是參加Beta測試的唯一方式,那些在指零售店預購《戰爭機器3》的玩家們可以在晚一周的4月25日提前享受這款2011年的頂尖TPS大作的風採。
  • 【TA說】諾貝爾化學獎終於發給了純化學什麼是超分子機器
    「化學是你,化學是我」,在歷年諾貝爾化學獎多次頒給生物、物理、生物化學、生物物理……之後,終於難得地頒給了純化學,卻讓很多人認為是
  • 生物機器還是機器生物?活的機器人出現,現在的難題以後都不算事
    提起機器人,我們可能想到的一是冷冰冰的機械以及各種零件,二就是電視電影中非常高智能的物種,不過最近英國有媒體報導稱,科學家們創造出了一種新的機器生物,暫且稱之為生物吧,就是一種「活的機器人」:是由活的細胞創造出來的全新的生命形式,聽起來是不是有點迷糊,有點難理解
  • 機器之血,超人大戰生化人,絕地逢生
    生化人為了拿到基因血種得到永生,肯定回去找博士的。現在上級命令龍叔馬上去保護博士安全撤離。無奈之下,龍叔只好忍痛前去執行任務了。隨後龍叔帶著一群絲襪特警來到了博士的家中,發現了這顆可以讓人重生的機器之心。但是剛出來,龍叔就接到女兒沒有搶救過來,已經去世的消息。
  • 郭為:機器對人只是功能性替代
    機器是功能性的突破,還是仿生的東西,就拿AlphaGo來講它下一盤圍棋所消耗的能量,有人告訴我需要2噸煤,但是一個圍棋手可能就是兩碗米飯,我們在考慮一個功能的時候需要多大的資源消耗,你可以實現這個功能,從實驗室走到工業,實驗室可以做得出來,但是無法實現工業化就是要考慮成本