美媒:阿里AI語音技術超越谷歌 可讀懂人類潛藏意圖

2021-01-11 參考消息

參考消息網12月11日報導上周,阿里巴巴旗下機器智能與技術實驗室在一個技術大會上展示了其人工智慧客服助手的表現。從演示效果來看,阿里巴巴人工智慧可以完成複雜的人類對話功能,讀懂人類潛藏意圖。知名科技雜誌《麻省理工科技評論》12月4日的報導認為,這一技術比谷歌的語音助手Duplex更勝一籌。

今年5月,谷歌發布的語音助手Duplex在業內引起了轟動。這是一款酷似人類的語音助手,可以幫助客戶進行餐廳預訂和沙龍預約。它的發布標誌著智能語音技術發展到一個新階段。

但目前看來,谷歌的Duplex推出的步伐很緩慢,中國科技公司阿里巴巴的語音助手卻在快馬加鞭地向前趕。12月2日,在2018年度神經信息處理系統大會(Neural Information Processing Systems conference)上,阿里巴巴展示了其物流公司菜鳥網絡旗下的人工智慧客服助手。

在預先錄製的演示電話中,人工智慧助手詢問客戶想把包裹送到哪裡。在對話中,人工智慧成功應對的幾個會話元素展示了其強大的自然語言處理能力。

人工智慧代理:好,我是菜鳥的語音助理。我是……

顧客:你好。

人工智慧代理:嗯,您好,有個包裹預定於上午送到文化西路588號。您方便接受嗎?

顧客:你是誰?

人工智慧代理:我是菜鳥的語音助理。我想確認一下您上午送到文化西路588號的貨。您方便接收嗎?

顧客:我上午不在家。

人工智慧代理:那您還有別的可用地址嗎?

菜鳥人工智慧代理演示視頻截圖。(企業供圖)

在30秒內,菜鳥人工智慧助手順利處理了三種常見的棘手會話成分:原有會話被打斷、非連貫性對話和潛藏意圖。人工智慧助手應對打斷的表現不言自明:其可以對客戶打斷對話做出響應並繼續傳遞相關信息,而無需重新啟動或跳過會話內容。

當客戶問「你是誰」時,會發生非連貫性對話,這就要求人工智慧助手記下客戶並沒有回答前面提出的問題,而是開始了新的詢問。作為響應,助手在返回到最初的問題之前重新進行自我介紹。

當客戶回答「我上午不在家」時,就會產生潛藏意圖。他從來沒有明確地說出他真正的意思,也就是送貨上門行不通,但人工智慧可以從字裡行間讀出意思,並智能地採取後續行動。

這些元素在人類之間的對話中可能非常普遍,但機器往往很難對其進行處理。從演示的效果來看,阿里巴巴的人工智慧語音助手能夠做到這一點,說明它比谷歌Duplex更複雜和智能。

目前,該人工智慧助手已經用於協調包裹投遞。阿里巴巴機器智能與技術實驗室主任金榕表示,它可以擴展到更多應用。

據透露,阿里巴巴還在為其他業務開發數字助理,其中包括可以在嘈雜餐廳和商店裡點餐的訂餐代理、一個可以回答有關產品問題的虛擬人物。此外,阿里巴巴旗下二手轉售平臺閒魚有20%的賣家已經在使用一款價格低廉的聊天機器人。

這些助手的核心是機器智能和技術實驗室開發的語音識別和自然語言處理引擎AliMe,它能夠被整合到不用的應用之中,適應更多的業務場景。阿里巴巴目前正嚴格控制這一技術的使用範圍,以避免該技術被應用於機器對人類的欺詐行為。

菜鳥網絡的數據顯示,快遞員每天大約要送150-200個包裹。以一個電話半分鐘至1分鐘計算,每天光打電話就要3小時。這項技術的應用能夠幫助每個快遞員每天節省3個小時,讓他們更輕鬆完成工作。

資料圖片:菜鳥智能語音助手產品運營專家走訪快遞網點。(企業供圖)

相關焦點

  • 全球頂尖科學雜誌:阿里AI語音技術超越谷歌,可讀懂人類潛藏意圖
    阿里巴巴近日一項在國際頂級學術會議上的AI語音技術演示,引起業界轟動。權威科學雜誌《麻省理工科技評論》認為,阿里巴巴的AI語音助手可以完成複雜的人類對話功能,甚至可讀懂人類的潛在意圖,顯示出阿里巴巴已經擁有比谷歌更好的AI語音技術。
  • 阿里巴巴AI助手讀懂人類潛在意圖 可模仿真人語氣對話
    權威科學雜誌《麻省理工科技評論》認為,阿里巴巴的AI語音助手可以完成複雜的人類對話功能,甚至可讀懂人類的潛在意圖,顯示出阿里巴巴已經擁有比谷歌更好的AI語音技術。不久前,阿里巴巴達摩院的科學家在機器學習領域會議NIPS(神經信息處理系統大會)上,演示了這項已應用於快遞領域的AI語音技術。
  • 谷歌推出語音準入特徵 可語音控制手機
    (原標題:谷歌推出語音準入特徵 語音控制手機)網易科技訊 4月13日消息穀歌推出的一個新語音特徵或可以幫助解決這個問題。目前處於測試階段的語音準入(Voice Access)特徵使得你可以通過聲音在屏幕上移動,切換到其它屏幕或者打開應用程式。你可以說出特定指令,例如「打開Chrome瀏覽器」或者「返回主屏幕」。語言準入以及其它應用程式的圖標邊上還有特定數字,你只需要讀出與特定應用程式相關的數字,即可打開這個應用程式。
  • 一文看懂語音技術商業化邏輯:對品牌意味著什麼
    聚焦AI,讀懂下一個大時代!選自:medium 作者:Marcel Kornblum 編譯:網易智能 參與:Rosie引言基於語音的技術將對許多行業產生巨大影響,在短短兩年內,預計50%的搜索將基於語音技術。
  • 美中火星探測器同月升空,美媒:火星探索將成為兩國競爭新舞臺
    美媒認為,美國和中國都在7月開始新的火星探索任務,為兩國間的競爭建立了新的舞臺。此外,其安裝的鑽頭等設備,可從巖石中收集巖心樣品。而對於執行中國首次火星探測任務的「天問一號」探測器,中國國家航天局探月與航天工程中心副主任劉彤傑表示,此次火星探測任務的工程目標是實現火星環繞探測和巡視探測,獲取火星探測科學數據,實現我國在深空探測領域的技術跨越;同時建立獨立自主的深空探測工程體系,推動我國深空探測活動可持續發展。
  • 谷歌高管談人工智慧:2029年超越人類
    據外媒報導,谷歌工程總監、著名未來學家雷伊·庫茲韋爾近日在奧斯汀舉行的SXSW大會上大膽預測:技術奇點時刻將在2029年到來,而那時人工智慧的智慧將超過人類。庫茲韋爾向來以精準地預測未來聞名於世,不知道這一次是否還會預測準確。
  • 一周AI大事盤點:谷歌利用AI預測風力發電量,騰訊論文被CVPR收錄
    谷歌利用人工智慧預測風力發電量2月27日消息,谷歌表示,利用DeepMind的機器學習算法來預測谷歌用於綠色能源計劃的風力農場發電量,該公司現在可以更合理地安排能源輸出時間,這對電網來說,比標準的、非基於時間的按時傳輸電量更有價值。谷歌指出,該軟體已將風能發電的價值提高了20%。速評:全球範圍內的風電技術持續發展,已成為最重要的可再生能源發電來源之一。
  • 谷歌推系列新功能 Chrome用戶可語音搜索
    14日展示了桌面搜索和移動搜索,其中包括桌面語音搜索以及圖片搜索。 網易科技訊 6月15日消息,據美國媒體報導,谷歌公司14日在舊金山舉行的新聞發布會展示了谷歌桌面搜索和移動搜索的一些新功能。其中包括桌面語音搜索和圖片搜索等。
  • 語音技術25年:人類還是無法和自己的電腦進行對話……
    一臺功能一般的計算機可以將連續的自然語音轉換為文本,準確率約為95%,這項技術已經超越了所有人,除了那些訓練最好的專業人員。為什麼語音識別直到最近幾年才被廣泛應用於日常生活中呢?這項技術更多是應用於工業。
  • 谷歌AlphaGO挑戰賽:人工智慧的邊界在人類
    谷歌AlphaGO的技術架構採用的是模仿人類大腦神經模式,而這種模式的行為可以理解為谷歌依託其強大的科學家團隊,在當前人類對於大腦相關探索的知識範圍內,以計算機的方式將這種知識探索表現到了一個新的高度。人工智慧的邊界在人類不論人工智慧如何發展,其在本質上還是物理程序層面的問題,哪怕其具備「自思考」能力,其思考的邊界也是開發者所賦予、設定的。
  • 谷歌驗證碼系統被破解 機器語音驗證準確率高達85%
    美國馬裡蘭大學的四位研究員開源了一個名為UnCaptcha的工具,能夠破解谷歌的驗證碼系統ReCaptcha,其進行語音驗證的準確率高達85%。與眾多驗證機制一樣,早期的ReCaptcha系統通過數字驗證碼進行識別,以此確保操作方是人類而非機器人。但是,2012年一個谷歌研究團隊幾乎百分之百破解了其文本驗證碼系統。
  • 白話文科普:我國量子計算超越谷歌100萬倍,技術路線有何不同
    今年9月,我國中科大的潘建偉團隊宣布實現在量子計算上達成50個光量子的操控,性能超越谷歌去年宣布的53個量子比特計算機100萬倍,並將在今年底前實現60個光量子的操控,五年內實現1000個光量子。這裡肯定有很多人不解,為什麼谷歌去年就實現了53個物理比特(transmon),而我國中科大今年僅僅實現了50個光量子的操控就能比谷歌快100萬倍呢?
  • 微軟和谷歌的人工智慧,在SuperGLUE基準測試中超越了人類
    當SuperGLUE剛被推出時,排行榜上表現最佳的模式和人類表現之間有近20個百分點的差距。但截至1月初,有兩個模型:微軟的DeBERTa和谷歌的T5 + Meena——已經成為第一個超越人類基線的模型。
  • 谷歌不願提供語音導航功能促使蘋果放棄谷歌地圖
    美國科技博客網站AllthingsD撰稿人約翰·帕茲諾斯(john paczkowski)周三引述多個知情人士的談話稱,蘋果要求谷歌為iOS 6 提供語音逐嚮導航功能,但是沒有達成交易。因此,蘋果決定放棄谷歌地圖。這樣,蘋果可以向用戶提供自己的逐嚮導航功能。谷歌競爭的Android平臺多年 以來一直提供這個免費的功能。
  • 美科學家研製讀腦裝置 可將腦電波翻譯成語音
    通過繪製腦電波所對應的語音,研究小組能夠閱讀人類大腦思想  【搜狐科學消息】 據美國探索頻道報導,通過匹配與大腦活躍性相一致的聲音,科學家正在進行一項最新研究,可幫助我們傾聽到人們的思想。大腦以不同的語音來表達獨特的電子活動性,通過觀看人類大腦電子活動性圖形,科學家能夠揭曉該大腦活動性所表達的單詞,這是一項重大研究,能夠「傾聽」無法說話群體的思想。  美國加利福尼亞州大學伯克利分校神經科學家布萊恩-帕斯利說:「如果某人完全處於癱瘓,或者一位患者處於病症狀態無法活動,但只要他的大腦仍處於活躍之中,我們便能夠完全理解他的思想意識。
  • 一周AI大事盤點:AI可分辨癌組織,AI還原魔方速度超過人類
    今天就帶你盤點過去一周(7月15日至7月21日)AI領域發生的熱點門事件:支付寶推出AR掃一掃識別垃圾的功能7月15日消息,支付寶方面宣布正式推出AR掃一掃識別垃圾的功能,用戶可通過支付寶首頁「掃一掃「中的「AR」功能識別垃圾類型,進行垃圾分類操作。同時,該功能還提供了直接預約上門收垃圾的服務,用戶通過掃描識別垃圾後,可直接跳轉到「易代扔」小程序中。
  • 三星智能電視已支持谷歌助手 可語音切換電視頻道
    【宅秘新聞】據外媒WinFuture消息,韓國電子巨頭三星現在正在德國推出針對智能電視的更新,其中將包括谷歌助手。到目前為止,三星智能電視支持的語音助手有自己的Bixby和亞馬遜Alexa,該公司希望用谷歌助手替換Bixby。
  • 排名 語音識別_語音識別技術排名 - CSDN
    近日,一則題為「詞錯率2.97%:雲從科技刷新語音識別世界紀錄」文章進入大眾的視野,文中的宣傳「將錯詞率(Word Error Rate,WER)降到了驚人的2.97%,較之前提升了 25%,已超越人類專業速記員水平。
  • 日媒:美中主導量子技術革命,日本恐遭淘汰
    日本經濟新聞09/19消息,圍繞以下一代計算機的量子計算機為首的量子技術,世界霸權之爭愈演愈烈。在顯示國家基礎研究能力的論文數量上,中國超過美國位居首位。繼半導體技術支持的數字社會之後,量子技術引領21世紀產業革新的可能性逐漸明顯。新時代技術的勢力圖,也會影響產業競爭力和國家安全。然而,日本卻應對遲緩,有掉隊之憂。
  • 美媒:谷歌斥巨資研究長壽裸鼴鼠
    參考消息網2月1日報導 美媒稱,「岡珀茨人類死亡率定律」讀起來不順口,但很容易理解:哺乳動物越老,就越可能死亡。這是一個有關生命的事實,但裸鼴鼠顯然是個例外。卡利科實驗室的一項新研究發現,這種外表光禿禿的齧齒動物的死亡風險不一定同它的年齡成正比。卡利科實驗室有著揭開衰老之謎的宏偉目標。