人類想聽懂動物的語言,AI能幫上忙麼?

2021-01-14 虎嗅APP

來源:智能相對論(aixdlun)


近日,有一個視頻在養寵圈中廣泛流傳,引無數養寵人士潸然淚下。視頻的主角是動物行為專家Heidi Wright和一隻生命即將走到盡頭的導盲犬,Heidi Wright以她的能力為媒介,將導盲犬的肢體動作和聲音翻譯成人語,幫助它和主人進行最後的交流。在Heidi Wright的轉述中,導盲犬表示了無法繼續守護主人的惋惜,還不停地呼叫另一隻狗夥伴,讓它照顧好主人。


這段視頻在引發人們感動的同時,也讓許多人感到遺憾,很多家庭都養有寵物,這些寵物陪伴了主人十數年,早已成為了特殊的家庭成員。可是絕大部分人都無法像上文提及的主人那般幸運,能夠傾聽到狗狗的心聲,在這名「親人」辭世時也只能抱憾相送。


無數人曾設想過,是否有可能出現一種翻譯工具,讓寵物的語言能夠被人類聽懂、理解呢?


人寵語言互譯並非偽命題


美國資深動物行為專家康·斯洛波奇科夫(Con Slobodchikoff)教授稱,未來五至十年內,人類使用一種手機大小的裝置——寵物語言翻譯器,便能與動物進行「對話」。這位北亞利桑那大學的生物教授花了30年研究草原土撥鼠的行為,他用AI軟體記錄並分析草原土撥鼠的叫聲,將其翻譯成英語。他還發現這些草原上的小傢伙們「具有語言所有方面的複雜通信系統」。而目前,他正試圖籌集資金來開發貓和狗的語音翻譯設備。


在這條未知明暗的道路上探索的顯然不止他一人。天下熙熙皆為利來,天下攘攘皆為利往,其實「寵物語言翻譯器」的低配版早就被放上了電商平臺,並取得了可觀的銷量,賣家聲稱這個設備經實測翻譯準確率高達80%。縱覽評論,「好玩」「有意思」「靈氣」之類的好評不在少數,從中我們也可以窺知消費者對於寵物語言翻譯器的需求與肯定。


4S營銷理論下,僅做到趣味性的滿足顯然不夠,寵物語言翻譯這塊才剛剛開掘的沃土已吸引了無數「賞金獵人」的眼光。如果按斯洛波奇科夫教授所說的,這項技術能在十年內成為現實,小範圍滿足的是人與寵物的交流溝通,大範圍可能是人類一統動物世界的溫和策略與夢想。


自動語音識別技術和語音翻譯技術助力


低配版寵物語言翻譯器運用的技術原理就是對狗狗的叫聲、動作等生物信號進行採樣,對獲取的數據進行頻譜分析,對姿勢動作DSP運算數位化處理,把得到的翻譯語言以中文形式語音播報出來。但是由於採樣的範圍和機器內存等的局限性,這種低配寵物語言翻譯器在翻譯的準確度和豐富性方面尚有待提高。相較之下,為實現人狗溝通而設計的No More Woof耳機要更勝一籌。


過去幾年,AI領域的進步帶來了自動語音識別技術和語音翻譯技術的顯著改進,計算機算法已經可以通過對大量數據進行的學習和訓練來解釋語言,而不是通過一組死板規則進行預編程。


No More Woof是由北歐發明與發現協會( NCID )開發的,應用的是三個不同技術領域的最新技術的組合,即腦電圖( EEG )傳感、微計算和專用腦-機接口(BCI)軟體,主要由腦電圖耳機、Raspberry Pi 處理器和一款便攜音箱組成。這些傳感器是腦電圖記錄器,可以降低讀數,減少離子電流在狗腦中的電壓波動。然後由微型計算機拾取波動,在這種情況下形成一個覆盆子pi,並對它們作出解釋。



例如,大腦中有一種特定的電信號來定義疲勞感,還有一些最容易被發現的神經模式:「我餓了」「我累了」「我很好奇那是誰?」「我想尿尿」……耳機中的傳感器會捕捉這種特殊的電信號,並將它們轉化為人們能夠聽懂的語言。


再結合基礎的自動語音識別技術和語音翻譯技術,計算機算法可以大致地分辨出寵物的情緒。這是短時間內寵物語言翻譯能達到的制高點,至於要通過寵物語言翻譯器來了解動物夥伴們真正的內心世界,還期待人類進一步的研究。


精確翻譯之路仍山高水遠,中間的代溝需要填平


需要指出的是,動物的大腦並不如人類的大腦複雜,人腦的活動通常有一個明確的目標導向,動物的大腦卻不一定。人的各種語言之間的轉換也具有相對窄範圍的對應關係,而動物的語言與人類的語言則對應範圍很寬,比如,狗會發出急促的叫聲,可能是因為想要向主人乞食,也可能是因為警惕陌生人,還可能是對主人不陪自己玩的責怪。如果它想表達的是這一種,而AI翻譯器卻傳達為另一種,那麼就容易將人和寵物之間的溝通引入「歧途」,從而完全喪失了寵語翻譯的意義了。


那麼有沒有可能通過AI實現完全精準的寵物語言翻譯呢?任重而道遠。通過自動語音識別技術和語音翻譯技術,計算機算法可以大致地分辨出寵物的情緒,但要明確更深層次的寵物肢體動作和叫聲的內在意圖,AI還需要一場「扭轉乾坤」的大革命。


在這方面,我們可以聯想AI在同聲傳譯上的表現,之前很多媒體搞起了「AI會取代哪些工作崗位」的預測,筆譯、口譯在許多預測中被認為被取代率高居榜首,這並非空穴來風。AI翻譯是當今AI領域的一個熱點,搜狗、谷歌、Facebook、網易等都削尖了腦袋想要分一杯羹,卯足了勁兒想要成為這一領域的領頭羊,畢竟人工翻譯領域人工成本高居不下。如果能用AI解決高成本問題,無疑劫走其中大部分的紅利。


然而,就目前來看,AI翻譯並沒有完全取代人工翻譯。相比於對其他事物的了解,人更了解人自身,而針對人自身語言所進行的AI翻譯尚且前路未朗,AI又如何在寵物語言翻譯領域嶄露頭角呢?在智能相對論(微信ID:aixdlun)看來,AI在寵物語言翻譯方面的應用,還需要填平這些「代溝」:


1. 數據關,成風盡堊之技無的放矢。要明確動物語言所表達的具體意義,需要先對動物的叫聲和即時腦電波動進行完整的採樣比對,再在這些數據的基礎上建立資料庫。而這兩種數據都存在著廣泛性和多樣性,以犬類為例,不同的犬種聲帶粗細寬窄各不相同。針對同一情景發出的叫聲分貝高低和尖細情況也不同,而刺激犬類發出叫聲的場景又是難以窮盡的,單單收集犬類的聲音樣本就是一個無比巨大的工程了,資料庫自然也難以完善。


2. 技術關,空手搏鬥難制勝。一個AI翻譯產品做到翻譯精確至少需要攻破幾個難題:形式端,拍譯要攻克圖像識別,同聲翻譯要攻克語音識別;內容端,攻克文本語言分析、大數據。而AI還沒有發展到能夠極為精確地處理這些問題的階段,機器缺乏對視覺場景、聽覺場景、自然語言處理的常識判斷。


如搜狗搜索在2017年6月的分享會上發布了創新產品搜狗翻譯APP,應用了基於生物學習的神經網絡機器翻譯(NMT)系統,將翻譯精確度提升到一個前所未有的高水準,然而在翻譯效果的「信達雅」上,仍然只做到了「信」 的層面,對語言背後的幽默、情感等豐富含義的解讀離人們所期待的水準還有些距離。


3.語義關,語料積累、場景收集和副語言與文化背景成痛癢之地。AI翻譯在文本或語言的寓意分析方面還強差人意。與人類語言相比,動物語言都是即時信號,信息內容全部關於當下,或示威,或示警,或示愛……從中看不到用語言來激起對過去的聯想的跡象,並且單個個體能發出的聲音形式太單一了,蘊含在其中的豐富信息難以明確表達。


寵物語言翻譯的難點不僅在於聲音的收集,更在於聲音背後具體含義的對應。這種對應是寬範圍的,難以精確的,機器缺乏對視覺場景、聽覺場景、自然語言處理的常識判斷,無法精確理解語音所表達的內涵,甚至在這個方面還比不上人類對動物語言的理解。人可以根據生活經驗來理解動物語言,比如看到狗狗衝著陌生人吠叫,人們可以推測它是在防備這個陌生人,而機器可能就沒辦法很好地理解這個畫面,從而做出錯誤的判斷。


又比如,「好」這個字是日常交際的常用字,在百度漢語顯示有19種語義,這些語義是結合具體場景來體現的,當偶遇熟人時,「好」的意思是問好;當別人徵求意見時,「好」用來表示同意;當人們商討時,又可以用「好」來表示反問……可見場景對於語義具有至關重要的影響,機器的正確理解場景的這件事上還需要加油,從而提高語義翻譯上的高精確性。


4. 「歷史包袱」難抖掉,AI難以跟上生命體的學習進程。狗的叫聲在一定歷史時期並不是一成不變的,狗憑藉自身的靈性以及主人的後天馴養,具備有學習能力,例如狗類中智商排名第一的邊境牧羊犬智力水平已經相當於6歲~8歲的小孩,經過學習,在放牧時它會用不同的叫聲來驅使羊群,控制羊群走向。還有一些寵物狗,甚至會在人類的刻意訓練下發出類似「媽媽」的叫聲,寵物語言在日新月異的變化,計算機卻很難抖掉語言的「歷史包袱」,這些也造成了寵物語言翻譯的困境。


動物語言和人語之間的代溝是客觀存在的,AI所能做的,只能是不斷改進自身的功能,用科學手段完善資料庫、內容、語料和場景。形式和內容雙管齊下,才能將這條橫亙在動物語言和人語之間的代溝填平,在堅實的地基上建立起實現人和動物「有效溝通」的「巴別塔」。


相關焦點

  • 揭秘動物語言翻譯器:打著AI幌子的娛樂產品
    這是最近一個網絡上點擊率較高的短視頻中的一幕。從網友評論來看,相比小狗的有趣表現,大家更好奇地是男子手機中的狗語翻譯器軟體:那麼神奇麼?早在2013年時,就有國外動物行為專家表示,未來5到10年,動物語言翻譯器或將面市,人類與動物溝通從此不成問題。
  • 海豚語言翻譯器 人類與動物交流成現實
    人一直都稱自己為「萬物之靈」,擁有地球上無可爭議的支配地位。不過,縱然人類能夠支配地球,也無法真正掌握很多我們所無法真正掌控的領域,即使是與我們所在同一個地球的生物,我們也沒法直接和他們溝通。在這一點上,很多人自稱能夠和動物交流,比如說張三丰,有部電視劇就說他能和動物交流,不過這都無從考證了。
  • 黑猩猩「坎茲」學會了人類語言,是否預示著動物間有各自的語言?
    研究人員對此表示:「我們沒有教它這些單詞的發音,它是自己『領悟』到的」它能看懂鍵盤上代替的物體和行動的符號字它能通過依序指出鍵盤符號創造序列已提出請求,回答人類研究者的口頭提問它本質上是開放的,能用來表達無限的事物。很多研究者都確信,只有人類能使用語言,而其他物種用來溝通的呼呼叫聲和手勢並不是語言。每種呼叫聲和手勢通常對應一條特定的信息,信息的總量有限,並不能組合成更加複雜的意義。例如某種猴子可能有一種特定的警告聲。對某種特定的天敵,比如蛇。但語言有無數種方式表達:「小心」,可以說「別動」,可以說「快跑」,可以說「有蛇啊」。
  • 《熊出沒》能聽懂動物語的人類,光頭強十級,只有這兩人滿級
    在整部戲中,我最羨慕的人,其實是那些能夠聽懂動物園的人類,他們實在是太無敵了,連動物的語言都能整明白,究竟都有誰呢?下面一起來分析下吧。長期待在馬戲團裡,與大部分動物能暢快聊天,可以和黑風說悄悄話,鐵定動物語10級以上。04納雅滿級納雅是生活在奇幻森林中一位神秘鹿族女孩,鹿族世代流傳的寶物金鹿角的守護者,身姿矯健,懂得以森林之語溝通萬物,善良單純,小心謹慎,在熊大他們遇上危險時,主動出手相救。
  • 懷孕生孩子,男人能幫上忙的事就這一件,大部分女人卻不樂意了
    懷孕生孩子這點事兒,關於準媽媽的一切被翻來覆去的說,卻很少討論準爸爸能做什麼……但其實,懷孕也好生孩子也罷,從來都不是準媽媽一個人的事情。今天要分享的就是,寶媽們關於「生產時老公要不要陪產」問題的一些討論,希望這些過來人的話,能給準媽媽們一些啟示。
  • 華為昨天售賣「動物語言翻譯圈」,去年已開始用AI技術拯救蜘蛛猴
    動物語言翻譯器就在昨天,「華為中國」在微博上發了一條消息:我,獸語十級,任何動物溝通不在話下。我研製出了「動物語言翻譯圈」,你想聽豬豬和鴨鴨說什麼嗎?華為雲EI產品經理朱威在視頻裡說:華為雲推出新一代人工智慧硬體設備——動物語言翻譯圈,只要把這款神奇的項圈戴在動物的脖子上,就能把動物說的話,翻譯成語言,用人聲表達出來,也可以顯示在手機APP上。然後朱威用一頭小豬來做實驗,那隻豬聽了音樂後,竟然說:「我要聽陳偉霆唱的。」
  • 漫威:索爾能聽懂他的語言,阿斯加德和花神巨像族有什麼關係?
    在漫畫之中花神巨像族只要不被燒成灰就都能重新生長然後復活,並且是自己的意識復活。而在電影之中變成了小樹枝重新發芽生長,然後以全新的靈魂復活,不再是以前的老格魯特,這一點需要特別注意。而能夠聽懂格魯特語言的人,從一開始的火箭浣熊,也增加到了整個兒銀河護衛隊團隊,和雷神索爾。
  • 臉書倆AI聊天機器人互聊,聊出一門人類無法理解的新語言
    微博網友發言:算不出的甲加乙:我突然在想人類是不是也是上一個文明的人工智慧,最後超越替代了上一個文明。有一天ai替代了人類繼續研究他們的ai,文明就這麼一次次進化!是的我確實是馬亮:機器人聊天軟體的基本原理就是儲存收集信息,開發者會將常用的詞句固化,然後設置磁性套索工具,當你對聊天軟體說早上好,他會回覆你開發者設置的原始回復,但是它會不斷積累新詞彙,然後篩選使用量最多的詞彙回覆你,它不不可能會分析情緒,所以它沒可能有情緒,它不會煩躁,不會憤怒,何來殺戮?
  • 考個教資周杰倫都能幫上忙是什麼意思? 一臉懵逼的你進來漲漲姿勢
    考個教資周杰倫都能幫上忙是什麼意思? 一臉懵逼的你進來漲漲姿勢時間:2020-11-01 00:16   來源:遊俠網   責任編輯:沫朵 川北在線核心提示:原標題:考個教資周杰倫都能幫上忙是什麼意思? 一臉懵逼的你進來漲漲姿勢 考個教資周杰倫都能幫上忙?
  • 領航鯨頻頻「迷路」,我們能否幫上忙?
    近三個月發現四起短肢領航鯨擱淺,引發研究者和海洋保護人士的極大關注領航鯨頻頻「迷路」,我們能否幫上忙?潛水員在水中陪護「萌丫」。在湛江東海島龍好灣沙灘發現的短肢領航鯨。茂名漁船把擱淺短肢領航鯨帶到離岸1海裡外的海域。鯨豚救治平臺。
  • 提升客廳美感,也許4種花卉能幫上忙,大氣又好養護
    提升客廳美感,也許4種花卉能幫上忙,大氣又好養護! 文/盆栽小棧 客廳這個空間,在室內的重要性是毋庸置疑的。所以很多人也會花大價錢去裝修、裝飾自己的客廳。不管是接人待客還是自家人娛樂休閒,客廳都是最為關鍵的一個空間。
  • 《人類簡史》:人類是早產兒,動物也有語言,小麥馴化人類
    也就是說,若是人類在母體呆至足月才降臨世界,那麼唯一發生的可能——就是難產!想一想,覺得非常有道理!小時家裡有養牛、羊、馬,以及豬。雖只得幾匹幾頭,也好歹讓我見識了小動物出生的過程。具體的出生當然在圈內,父親不準孩童入內,但小豬小牛生下來就能撒歡地跑,卻讓我記憶深刻。
  • 智能音箱多到數不過來,然而讓機器聽懂世界的科幻未來還有多遠?
    一、讓機器聽懂世界承載了人類千年夢想 語言承載了人類文化,人類需要通過語言學習知識和傳遞信息,這是人類區別於動物界最重要的特性之一。而且,人類語言超過了五千多種,人類將大部分時間花費在學習各種語言上似乎也不是一個更有效的途徑。
  • 鳥的方言你能聽懂多少?
    可能人居住的地方危險的動物比較少,對它們而言也更安全。只要綠色植物比較多,食物和繁殖就不是難事。一般早晨和下午是白頭鵯最喜歡歌唱的時間。如果在鄉下,早晨去遛彎你總會能聽到它們的聲音。交配期的雄性喜歡站在比較高的地方,像樹的頂端,電線桿等明顯寬闊的地方。一是容易被異性注意到,二十聲音沒有阻隔能傳得更遠。如果你仔細聽它們的叫聲就會聽出規律來。
  • 【全國女檢協會議·人物】玉喃溜:讓你聽懂我的語言
    所以,我也一直想為家鄉做點什麼。該案涉案人員眾多、組織嚴密、分工明確,他們通過非法通道以繞關避卡、買點、在凍製品上加蓋礦石掩蓋等方式逃避查緝,將來自境外疫區的動物凍製品,運往中國各地進行分銷。儘管這是一個錯綜複雜的跨境犯罪案件,但在大家的共同努力下,我們僅用了短短25天的時間,就將43名被告人繩之以法。
  • 人工智慧進入翻譯領域:讓計算機聽懂人類語言
    在國際會議上,翻譯人員是人們熟悉的,但翻譯機器人就鮮見了?日前,在國際計算語言學聯合會2015年年會(ACL-2015)的終身成就獎頒獎互動環節上,來自百度公司的機器人「小度」,就擔任起了這樣的角色。  「我們想進一步把人和計算機聯繫起來,就要對人的自然語言進行處理。」說這話的正是「小度」翻譯的服務對象,來自哈爾濱工業大學的教授李生。
  • 被飯圈語言支配的生活,你被影響了麼?
    作者:歌編輯:北樓8層女同事「TB」、「NCF」、「ZQSG」、「WF」、「XJ」……這些字母拼寫,你能猜到什麼意思麼?隨著網絡日益年輕化,很多飯圈粉絲已經把這些字母縮寫融進日常在生活中,還有像「帶節奏」、洗地」、「吃瓜等反轉」等詞彙在我們生活中更是無處不在,甚至比我們很多正常語言使用都頻繁。
  • 一周AI大事盤點:AI幫助農民精準除草,AI可分析動物行為
    在人工智慧的幫助下,農民不用在整塊土地上噴灑農藥,他們只需要瞄準特定的區域,在正確的時間和地點進行幹預即可。 研究人員開發出可區分諷刺和假新聞的AI11月6日消息,喬治華盛頓大學、亞馬遜AWS AI以及AdVerifai公司的研究人員開發了一種機器學習方法來對誤導性語音進行分類。據了解,在未來的工作中,研究人員還計劃研究語言線索,例如荒謬、不協調以及其他與幽默相關的特徵。
  • 科學家們破譯了海豚的「語言」?以後人類說不定真能和海豚聊天
    一直以來,人類都幻想能和海豚這類智商頗高的動物進行交流。因此,弄明白海豚與同類交流的方法,或許就能撬開人類與海豚交流的大門。最近網上很火的一個說法是,海豚能夠利用聲吶系統,以全息圖的形式把自己曾經接收到的信息直接發送給同類——這相當於聊天自帶圖片和表情包,比人類蒼白的語言生動多了!
  • 鄒炎炎:語義分析介紹及跨語言信息在語義分析中的應用 | AI 研習社...
    近日,在雷鋒網 AI 研習社公開課上,新加坡科學設計大學在讀博士鄒炎炎就用通俗易懂的語言為大家介紹了 semantic parsing 的概念、背景以及自己在該領域的論文成果,並介紹了關於 output embedding 對於 semantic parsing 的影響。公開課回放視頻網址:http://www.mooc.ai/open/course/544?