全球頂尖科學雜誌:阿里AI語音技術超越谷歌,可讀懂人類潛藏意圖

2020-11-29 觀察者網

阿里巴巴近日一項在國際頂級學術會議上的AI語音技術演示,引起業界轟動。權威科學雜誌《麻省理工科技評論》認為,阿里巴巴的AI語音助手可以完成複雜的人類對話功能,甚至可讀懂人類的潛在意圖,顯示出阿里巴巴已經擁有比谷歌更好的AI語音技術。

(《麻省理工科技評論》近日報導截圖)

不久前,阿里巴巴達摩院的科學家在機器學習領域頂級會議NIPS(神經信息處理系統大會)上,演示了這項已應用於快遞領域的AI語音技術。在約30秒的時間裡,菜鳥語音助手在經歷了被用戶打斷、更改意圖、沉默等交互後,依然能夠應對自如,順利幫助用戶完成了快遞派送地址的更改。

今年5月份,谷歌曾發布一款酷似人類的的語音助手Duplex,可以幫助客戶預定餐廳。這在業界引起了不小的關注。

但《麻省理工科技評論》認為,阿里巴巴演示中發生的一幕,揭開了人機語音交互的新序幕:當AI問用戶明天早上是否可以派送時,用戶回答「我早上不在家」,阿里巴巴的AI語音助手沒有直接回答「是」或「否」,而是讀出人類背後潛藏的意圖,並採取後續行動。

「類似表達在人類對話中可能非常普遍,但機器往往很難對其進行處理。從演示的效果來看,阿里巴巴的AI語音助手能夠做到這一點,說明它比谷歌更高級。」《麻省理工科技評論》認為,這顯示出阿里巴巴在AI語音領域的技術能力已經超出谷歌。《麻省理工科技評論》是全球影響力最大、最權威的科技雜誌之一。

此外,阿里巴巴的語音助手能讓機器在跟人交互過程中既能"說"又能"聽",並能模仿真人的語氣、語調、語速,整個對話過程幾乎聽不出是機器在跟人交互。今年5月,阿里巴巴在國內展示這一技術時,現場就有觀眾驚呼太逼真了。

在今年雙11期間,這款語音助手已為數百萬用戶提供服務。菜鳥提供的數據顯示,平均每個快遞員每天大約要送150-200個包裹,以一個電話半分鐘至1分鐘計算,每天光打電話就要3小時。這項技術的應用能夠幫助快遞員節省時間,更輕鬆地完成工作。

據悉,阿里巴巴目前正在限制這一技術的使用範圍,以避免該技術被應用於機器對人類的欺詐行為。(莊怡)

附現場演示視頻對話全錄:

智能助手:「您好,您有一個上午送到文一西路588號的中通快遞,請問方便籤收嗎?」

用戶:「您哪位?」

智能助手:「我是菜鳥語音助手,在快遞員派送前跟您確認」

用戶:「我上午不在家呢」

智能助手:「那您方便留一個籤收地址嗎?我轉告快遞員為您安排。」

用戶:「是什麼東西啊?」

智能助手:「物流單上顯示是文件」

用戶:「嗯,那幫我放物業吧……算了,還是給我放到門口吧」

智能助手:「是送到門口是把?」

用戶:……(沉默狀態)

智能助手:「喂,還在嗎?給您放在門口可以嗎?」

用戶:「可以的」

用戶:「啊,對了,我好像還有一個中通的包裹,今天會派件嗎?」

智能助手:「您稍等,這裡看到您有一個中通快遞的包裹,預計明天到達」

用戶:「謝謝,再見」

智能助手:「再見」

相關焦點

  • 美媒:阿里AI語音技術超越谷歌 可讀懂人類潛藏意圖
    參考消息網12月11日報導上周,阿里巴巴旗下機器智能與技術實驗室在一個技術大會上展示了其人工智慧客服助手的表現。從演示效果來看,阿里巴巴人工智慧可以完成複雜的人類對話功能,讀懂人類潛藏意圖。知名科技雜誌《麻省理工科技評論》12月4日的報導認為,這一技術比谷歌的語音助手Duplex更勝一籌。
  • 阿里巴巴AI助手讀懂人類潛在意圖 可模仿真人語氣對話
    權威科學雜誌《麻省理工科技評論》認為,阿里巴巴的AI語音助手可以完成複雜的人類對話功能,甚至可讀懂人類的潛在意圖,顯示出阿里巴巴已經擁有比谷歌更好的AI語音技術。不久前,阿里巴巴達摩院的科學家在機器學習領域會議NIPS(神經信息處理系統大會)上,演示了這項已應用於快遞領域的AI語音技術。
  • 一周AI大事盤點:谷歌利用AI預測風力發電量,騰訊論文被CVPR收錄
    谷歌利用人工智慧預測風力發電量2月27日消息,谷歌表示,利用DeepMind的機器學習算法來預測谷歌用於綠色能源計劃的風力農場發電量,該公司現在可以更合理地安排能源輸出時間,這對電網來說,比標準的、非基於時間的按時傳輸電量更有價值。谷歌指出,該軟體已將風能發電的價值提高了20%。速評:全球範圍內的風電技術持續發展,已成為最重要的可再生能源發電來源之一。
  • 一文看懂語音技術商業化邏輯:對品牌意味著什麼
    聚焦AI,讀懂下一個大時代!選自:medium 作者:Marcel Kornblum 編譯:網易智能 參與:Rosie引言基於語音的技術將對許多行業產生巨大影響,在短短兩年內,預計50%的搜索將基於語音技術。
  • 谷歌推出語音準入特徵 可語音控制手機
    (原標題:谷歌推出語音準入特徵 語音控制手機)網易科技訊 4月13日消息穀歌推出的一個新語音特徵或可以幫助解決這個問題。目前處於測試階段的語音準入(Voice Access)特徵使得你可以通過聲音在屏幕上移動,切換到其它屏幕或者打開應用程式。你可以說出特定指令,例如「打開Chrome瀏覽器」或者「返回主屏幕」。語言準入以及其它應用程式的圖標邊上還有特定數字,你只需要讀出與特定應用程式相關的數字,即可打開這個應用程式。
  • 谷歌推系列新功能 Chrome用戶可語音搜索
    14日展示了桌面搜索和移動搜索,其中包括桌面語音搜索以及圖片搜索。 網易科技訊 6月15日消息,據美國媒體報導,谷歌公司14日在舊金山舉行的新聞發布會展示了谷歌桌面搜索和移動搜索的一些新功能。其中包括桌面語音搜索和圖片搜索等。
  • 谷歌高管談人工智慧:2029年超越人類
    據外媒報導,谷歌工程總監、著名未來學家雷伊·庫茲韋爾近日在奧斯汀舉行的SXSW大會上大膽預測:技術奇點時刻將在2029年到來,而那時人工智慧的智慧將超過人類。庫茲韋爾向來以精準地預測未來聞名於世,不知道這一次是否還會預測準確。
  • 三星智能電視已支持谷歌助手 可語音切換電視頻道
    【宅秘新聞】據外媒WinFuture消息,韓國電子巨頭三星現在正在德國推出針對智能電視的更新,其中將包括谷歌助手。到目前為止,三星智能電視支持的語音助手有自己的Bixby和亞馬遜Alexa,該公司希望用谷歌助手替換Bixby。
  • 語音技術25年:人類還是無法和自己的電腦進行對話……
    一臺功能一般的計算機可以將連續的自然語音轉換為文本,準確率約為95%,這項技術已經超越了所有人,除了那些訓練最好的專業人員。為什麼語音識別直到最近幾年才被廣泛應用於日常生活中呢?這項技術更多是應用於工業。
  • 白話文科普:我國量子計算超越谷歌100萬倍,技術路線有何不同
    去年穀歌宣布達成53量子,實現量子霸權,而我國今年也超越谷歌100萬倍,間接宣布實現了量子霸權。谷歌的量子比特谷歌的量子比特走的是比較務實的路線,一個可操控的糾纏態量子實現一個量子比特位。這個就比較好理解了,53個量子的操控,就是53個量子比特,跟經典計算機的比特是一個道理。
  • 谷歌AlphaGO挑戰賽:人工智慧的邊界在人類
    谷歌AlphaGO之所以引起了全球範圍內的關注,除了谷歌一直以來在資本市場上有著非常卓越的市值管理能力之外,其技術本身的突破也是大家關注的焦點。從技術架構層面來看,最大的特點就是突破了傳統計算機的「固定」程序邏輯,其最大的突破就是融入了自學習,或者說是深度學習的能力,這也就意味著谷歌AlphaGO與傳統意義上的電腦程式有了很大的區別。
  • 排名 語音識別_語音識別技術排名 - CSDN
    近日,一則題為「詞錯率2.97%:雲從科技刷新語音識別世界紀錄」文章進入大眾的視野,文中的宣傳「將錯詞率(Word Error Rate,WER)降到了驚人的2.97%,較之前提升了 25%,已超越人類專業速記員水平。
  • 想像科技領跑MIT & Harvard,全球首個心理健康語音篩查模型將面市
    深耕心理健康領域20年的想像科技早在2017年就提前探索AI+心理健康的可能性,期間不斷迭代技術,推出了智能語音心理健康平臺健康歐(Relax O),並預計在未來15個月內,超越麻省理工(MIT)及哈佛(Harvard)團隊,建立全球第一個語音心理健康篩查模型。
  • 谷歌驗證碼系統被破解 機器語音驗證準確率高達85%
    美國馬裡蘭大學的四位研究員開源了一個名為UnCaptcha的工具,能夠破解谷歌的驗證碼系統ReCaptcha,其進行語音驗證的準確率高達85%。與眾多驗證機制一樣,早期的ReCaptcha系統通過數字驗證碼進行識別,以此確保操作方是人類而非機器人。但是,2012年一個谷歌研究團隊幾乎百分之百破解了其文本驗證碼系統。
  • ZLG深度解析:語音識別技術
    語音識別已成為人與機器通過自然語言交互重要方式之一,本文將從語音識別的原理以及語音識別算法的角度出發為大家介紹語音識別的方案及詳細設計過程。語言作為人類的一種基本交流方式,在數千年歷史中得到持續傳承。近年來,語音識別技術的不斷成熟,已廣泛應用於我們的生活當中。語音識別技術是如何讓機器「聽懂」人類語言?
  • 谷歌發布新版Chrome瀏覽器 添加語音識別功能
    谷歌在Chrome瀏覽器上下了大工夫(TechWeb配圖)【TechWeb報導】2月26日消息,據國外媒體報導,科技網站eweek稱,谷歌最新版瀏覽器Chrome 25在經過一段時間用戶體驗測試後,目前終於上線,面向所有用戶免費下載。
  • 蘋果為何放棄谷歌地圖:無法使用語音導航
    不過,多名熟知蘋果想法的消息人士透露,該公司覺得自己除了用自己開發的地圖應用來取代谷歌地圖以外別無選擇,原因是雙方在一個關鍵特性上無法達成一致,那就是語音逐嚮導航技術。谷歌Android行動作業系統從幾年前就已開始免費提供語言逐嚮導航服務,但iOS版谷歌地圖服務從未提供這項功能。消息人士稱,蘋果非常希望iOS 6能具備這項功能。
  • 微軟和谷歌的人工智慧,在SuperGLUE基準測試中超越了人類
    當SuperGLUE剛被推出時,排行榜上表現最佳的模式和人類表現之間有近20個百分點的差距。但截至1月初,有兩個模型:微軟的DeBERTa和谷歌的T5 + Meena——已經成為第一個超越人類基線的模型。
  • 智能家居的突圍:什麼樣的NLP數據讓語音交互更智慧
    一方面,AI技術與家居生活應用的進一步結合,更催化了眾多行業標杆企業的飛速發展,諸如小米、百度等公司;另一方面,從嚴格意義上智能家居產品分類涵蓋了家電、娛樂、能源供暖、廚房用品、安全健康等,中國作為全球智能家居市場的發展重心,人們對於生活品質與家居產品體驗的追求也將不斷增加。由於智能家居多以房屋、住宅、社區為載體,應用場景相對更具集中性和確定性。
  • 谷歌不願提供語音導航功能促使蘋果放棄谷歌地圖
    美國科技博客網站AllthingsD撰稿人約翰·帕茲諾斯(john paczkowski)周三引述多個知情人士的談話稱,蘋果要求谷歌為iOS 6 提供語音逐嚮導航功能,但是沒有達成交易。因此,蘋果決定放棄谷歌地圖。這樣,蘋果可以向用戶提供自己的逐嚮導航功能。谷歌競爭的Android平臺多年 以來一直提供這個免費的功能。