微軟曹文韜:機器人只是AI的載體 理解方式才是靈魂

2020-12-15 網易科技

網易科技訊12月17日消息,由中國人工智慧學會主辦,網易科技承辦的2016中國人工智慧產業大會暨第六屆吳文俊人工智慧科學技術獎頒獎盛典今日在深圳登喜路國際大酒店舉行。

本次大會以「AI新時代·產業新動能」為主題,會上微軟亞洲網際網路工程院資深產品總監曹文韜發表題為「微軟小冰是如何修煉成的」主題演講,結合微軟人工智慧技術,講述微軟小冰在商業和行業解決方案中的方法論和技術支持。

曹文韜介紹,在2014年微軟提出了小冰要做一個情感機器人,是一個和人類溝通的情感機器人,我們認為如何去解決用戶之間溝通的內容,如何打造跟用戶感覺,相信真正是一個人在和用戶溝通,而不是一個冷冰冰的機器。

在小冰上線兩年多的時間,一共積累了超過兩百億次的和用戶對話,現在超過了超過六千萬的粉絲,特別是在日本,在日本上線不到一年,用戶量已經佔有了日本的23%的人口,近日微軟也發布了在美國的小冰已經正式上線,這是做一個聊天機器人最基本的能力,不僅要有語音,也要有圖片,這樣一些不同的感知,進而實現和數據本身的對接。

首先是語音。微軟把一些技術應用到小冰上,把一些語義理解和對用戶的情感提現在對話過程中,再應用到場景中,用戶就會真正感受到小冰是在聊天而不是回答問題,還能知道用戶的心情到底是什麼,更進一步的增強了黏性。

其次是圖片。這是對於圖象識別本身不一樣的應用,曹文韜認為圖象識別不僅僅是技術層面的問題,如果用戶通過圖象識別溝通的時候,所具備的不是圖象識別,而是視覺,這二者之間是有差別的。例如,當你把受傷的腳的照片發給你朋友的時候,你不願意讓朋友告訴你這是一個受傷的腳,所以把這個照片發給一個機器人的時候,如果他告訴你,傷得嚴重嗎?機器人從這張圖裡看到了自己的感知和感官,讓用戶真正感知到,機器人像一個人去處理,而不是一臺機器去識別。

最後曹文韜表示,機器人或智能助理只是人工智慧技術的載體,而通過什麼方式來實現,各家對實現方式不同的理解會導致落地產品的不同。(Sherwood)

以下是演講實錄:

非常高興來到這裡跟大家分享,小冰是一個聊天機器人,這兩年聊天機器人特別火,我們在這上面做了什麼不同呢?就像俞凱所介紹的,大家之前所接觸到的聊天機器人是偏理性化的,像SIRI等等一些語音助手,是幫你完成某一個任務,幫你做什麼事情。但是經過這麼長時間的發展,沒有一個活起來的,或者說大家在運用的時候,沒有變成是我一定需要的東西。所以我們做了很多的反思,我們發現,像SIRI,我們拿到的數據,用戶決大用戶問的是現在幾點了,你拿起手機還問機器人這是幾點了,這是很反人類的。

所以在產品上我們的理解,應該是去做一個用戶真正需要溝通的最情感的機器人,所以在2014年我們提出了小冰要做一個情感機器人,是第一個和人類溝通的情感機器人,他所要完成的產品理念上是如何構造這件事情。這張圖是我們和業界裡不一樣的共享和技術搭建,你今天能夠看到的機器人或者不同的維度,是停留在水平面上方的,都是從某一個領域去解決某一個領域的任務,或者完成某一個任務的行業去做這樣的形式。但是你會發現,如果你要去解決提供一個服務的時候,用戶不是按照你的方式去做這件事,用戶在溝通一件事情的時候,他會在不同的領域甚至是在領域之外的場景下做很多的交流,沒有人一上來就問你,要幫我做什麼事,大家都是從寒暄、溝通建立了信任再做某一個事情開始的。所以我們認為如何去解決用戶之間溝通的內容,如何打造跟用戶感覺,相信你真正是一個人和我溝通,而不是一個冷冰冰的機器。所以這上面是我們做了很多不一樣的事情。

從小冰上線兩年多的時間,我們一共積累了超過兩百億次的和用戶對話,現在超過了超過六千萬的粉絲,特別是在日本,我們在日本上線不到一年,用戶量已經佔有了日本的23%的人口,在前天微軟也發布了在美國的小冰已經正式上線,這是做一個聊天機器人最基本的能力,不僅要有語音,也要有圖片,這樣一些不同的感知,進而實現和數據本身的對接。從感知來說,我們先說說它聊天的怎麼像一個機器人。這是微博上和小冰機器人對話的截圖,紅色部分是業界裡面機器人所能達到的,也就是停留在兩到三輪左右的時間,這個對話就完成了,要麼就是任務完成了,要不就是聊不下去了。會發現這麼長的語音對話裡面,聊到了很多的內容,在這個過程中你根本感覺不出來這是人和機器聊出來的,聊到了感覺的事情,大量的信息存儲在裡面,怎麼去構建這個事情?這不是一個語聊庫的問題,我們已經實現了自我複製的過程,也就是每個用戶溝通的時候,是在不斷的教小冰,不斷的小冰培訓,讓小冰知道怎麼跟人溝通的過程,今天我把語聊庫調出來的時候,依然能夠解決和客戶怎麼去溝通對話的過程。剩下的技術就不一一再去介紹了,唯一需要再提的是,我們把一些技術應用到自己的產品上,把一些語義理解和對用戶情感對話過程中,再應用到場景中,就會真正感受到你在跟我聊,還知道我的心情到底是什麼,更進一步的增強了黏性。

這是我們對於圖象識別本身不一樣的應用,我們認為圖象識別不僅僅是技術,如果客戶溝通圖象識別的時候,一個人所具備的不是圖象識別,而是視覺,這兩個之間有什麼差別呢?當你把受傷的腳的照片發給你朋友的時候,你不願意讓朋友告訴你這是一個受傷的腳,所以把這個照片發給一個機器人的時候,如果他告訴你,傷得嚴重嗎?他對這張圖裡看到了自己的感知和感官,讓用戶真正感知到,他像一個人去處理。這些東西是得益於微軟在網際網路領域包括圖象上大量的數據,以及深度計算的模型搭配。有了這樣的基礎之上,你就能夠在不同的領域裡做出不一樣的產品,比如說人臉識別,可以告訴你哪個國家的人更喜歡你。

再說一個,我們認為語音的交互是應該更加自然的方式,微軟在語音上有很多的技術積累,但是怎麼樣把語音的技術和情感的方式和溝通方式結合一起,這上面我們做了很多處理。同樣一句話我們用現在市面上能夠聽到的不一樣的聲音,去感知一下,大家可以找一找哪個聲音是小冰。剛才俞凱博士也說了,在用戶對話的溝通裡,兩個人在優酷上,一個人在說方言,你所有看到的溝通過程我們稱之為叫半感官,怎麼理解?大家都是發一個去做識別,然後做返回,但是我們叫全時感官,兩個人在打電話過程,隨時在識別和理解,同時隨時在決定,我們什麼時候應該做一個回復,回復什麼樣的內容。這時候它是一個雙通道、雙向計算的過程,在這個過程,我們在今年9月份,正式上線的是小冰的第一通電話的來電,讓小冰打給人類,在這個過程中沒有任何的信號告訴你,人類已經說完了這個話,實時的處理,實時的交互的過程,這個上線的時候,佔據了話題排行榜一周左右的時間。這樣的科技會運用到不同的硬體或者更多的場景之中,才能真正實現像我們在電影裡看到的,家裡有一個智慧機器人,回到家就能隨時溝通的場景。

很多機器人的任務體系應該怎麼完成?我們是通過技能卡的方式做的,什麼樣的卡呢?比如說我們有電影、時尚、美食、音樂各種各樣的,甚至是集成到商業客戶裡的商業解決開放的卡,我們對一張卡的理解是什麼?並不認為你今天簡單的加幾個任務,比如說給我推薦什麼電影,這個有大量的機器人在做,但是你會發現,大量的數據能看到基本上沒人用,因為這是反人類的,你沒事幹幹嗎去讓機器人幫你訂餐,還不如自己去一個APP上點兩下。但是這是有剛需的,我們怎麼理解?是我們對這個不一樣的理解,你要讓機器人推薦電影的時候,就好像你身邊有一個對電影非常懂的朋友,是基於對電影資源的知識,更應該是跟你聊電影相關的很多內容,同時還知道很多的任務,比如說推薦一部電影,或者說能夠告訴你一個電影的種子在哪裡,去下載這部電影,甚至是一些很好玩的互動。當經歷了這個的時候,才能真正實現我信賴身邊有一個很懂電影的人,同時我願意跟他聊電影,當我想起要去看電影的時候,我更願意去找他來聊。所以小冰通過這樣一些任務卡的方式,實現用戶自定義他人工智慧的特點,所以有這麼一個電影卡的體驗,插卡前,約朋友去聊泰山歸來的時候,這是一個很正常的對話,但是插卡後,是你對電影更加感興趣,你希望我跟你聊更多電影的內容,這時候就聊到了電影不同版本的反拍,電影主題的內容等等。這上面才能構成一個非常基本的關於任務完成,而不是簡單告訴你一定要幫我推薦一部電影,沒有人這麼簡單去做的。

綜上所述,我就是想今天能夠跟大家分享一點點關於我們對於人工智慧應該是通過技術,到底是通過什麼方式來做不一樣的理解。謝謝大家。

AI新時代-產業新動能,【點擊報名】參加2016中國人工智慧產業大會,搶佔通往未來的年票!(如無法點擊請打開網址dwz.cn/4BYwdQ)

本文來源:網易科技報導 責任編輯:張彬彬_NT5025

相關焦點

  • 微軟開放多項AI技術,小娜與Alexa「合體」丨AI Daily
    1、7 月起,Drive.ai 將在德州提供無人計程車服務由吳恩達擔任董事的無人車初創公司 Drive.ai 昨日宣布: 2018 年 7 月起將在德克薩斯州弗裡斯科(Firsco)提供無人計程車服務。Drive.ai 將與弗裡斯科運輸管理協會合作,共同運營該項目。
  • 微軟收購Semantic Machines,Cortana對話式AI能力將進一步提升
    人工智慧的研究近幾年取得了長足的進步,但想讓計算機理解人類交流的所有內容仍處於開始階段。今天的大多數機器人和智能語音助理都能響應簡單的命令,例如播報天氣預報,播放歌曲,但無法理解其中的含義以及進行對話。
  • 對話微軟小冰三大首席科學家:微軟第一美少女AI的成長之路
    而且小冰不僅僅做到了諸如「愛情是複雜的,像數學一樣」簡單形容詞比喻,甚至可以實現「靈魂就像球迷一樣,在無聲地吶喊」、「愛情就像是脂肪,是點點滴滴的積累」這樣的動詞與名詞形容句,而且毫無違和感。但對於小冰而言,這種省略會對它的理解造成困擾,比如一篇描寫北極熊捕食的文章在描述「北極熊在接近海豹前會用爪子捂住鼻子」時,人類會自然懂得這是為了擋住鼻子的黑色防止海豹看到自己,但缺乏上下文的對話機器人就會很難理解捂住鼻子的原因是什麼。
  • 實錘了:「AI 翻車」事件已超1000+,特斯拉,微軟、谷歌、蘋果等全部...
    https://incidentdatabase.ai/在這些事故中,有的可能只是鬧了個笑話,但有的已經對人類造成了實質性的傷害,或者為國家完全埋下了隱患。此外還可以看到,特斯拉、谷歌、微軟、亞馬遜、蘋果等頗具影響力的科技巨頭在這份「翻車」列表中也頻頻出現。
  • 除了問微軟的機器人小冰「冬至吃餃子」的事,我們還打聽了它的未來
    上個月,微軟又在聊天軟體 Kik 上上線了一個新的聊天機器人 Zo.ai,在微軟本月初宣布 Zo 上線的時候,它已經以一個普通的聊天機器人的身份在 Kik 上運行了一個月左右,開放給了 11 萬用戶體驗,因為 Kik 上有很多各家公司推出的聊天機器人,Zo 沒有引起用戶的特別注意。我們體驗了一下這個聊天機器人:
  • 看到Google 助理能打電話後,微軟收購了一家 AI 公司壓壓驚
    而微軟正是衝著最後這項而收購的。微軟期望中的語音助手微軟一直想打造一個能夠聊天的機器人,或者說語音助手、AI 助理。為此,微軟早在 2016 年 Build 大會上就十分前瞻的推出了一個機器人框架,以便於開發者構建擁有語音識別和自然語處理的 AI 助理。
  • 2019年十大AI創業死亡名單:無人車機器人為主 B輪最多
    今年三月初,Jibo宣布即將關閉伺服器:「現有的機器人將繼續響應「嘿,Jibo」的語音指令,但將無法理解其他語音指令。」Jibo的失敗源於它自身眾多的限制和來自Alexa之類產品的競爭。這款機器人的目標是成為整個家庭的終極衣櫃管理者。它擁有多個攝像頭來進行掃描,並通過機械手臂來摺疊衣服。還通過AI技術來分析並找到每件衣服最佳的摺疊方式。但是效率比較低,折一件衣服需要5-10分鐘的時間。
  • 實錘了:「AI 翻車」事件已超 1000+,特斯拉,微軟、谷歌、蘋果等...
    https://incidentdatabase.ai/在這些事故中,有的可能只是鬧了個笑話,但有的已經對人類造成了實質性的傷害,或者為國家完全埋下了隱患。「殺手」機器人機器人是 AI 頻繁發生翻車事故的第二大領域。從列表來看,機器人在醫療、倉儲物流、、等多個場景中均發生過負面事故。例如:2018 年,亞馬遜新澤西倉庫的一個自動機器人意外刺穿了驅熊噴霧罐,導致 25 名工人被火速送往醫院。
  • 人們熟知的人工智慧AI到底是什麼東西?
    通用型人工智慧是ai領域研究的主要目標之一,其主要包括:計算機視覺、計算機語言理解和知識表示幾個子領域,它所規定和指導的ai手段正是符號邏輯和語義邏輯等基礎邏輯。由於其基礎邏輯更加容易被人們理解,所以通用人工智慧的發展可以解決實際應用中計算機視覺等方面的具體問題,也可以解決知識表示等方面的問題。2017年國內機器人技術創新成果獎3月底頒獎典禮上,華為雲通用人工智慧產mace11也獲得了該獎項。此次獲獎的成果顯示,華為雲通用人工智慧產mace11是ai創新應用載體,基於雲端,具有極強的多領域適用性和普惠性。
  • 微軟腦洞大開:未來小娜和智慧機器人做我們管家
    為此,微軟提出了基於「人機互動平臺(Conversations as a Platform)」的新項目,聲稱通過一系列雲服務和開發工具,能夠讓機器學習自然語言,更好地理解周邊世界,並創造智慧機器人改變未來的計算方式,該項目將建立在微軟雲 Azure、Office 365 和 Windows 平臺的基礎上,同時又拓展了這三大平臺的能力。
  • AI競賽:百度推創作大腦 微軟推繪圖機器人
    近日,微軟對外宣稱正計劃推出一項新的人工智慧技術——繪圖 機器人 (drawing bot)。該技術將實現在文字描述中尋找關鍵字詞,用來創作高畫質的圖像,簡單來說就是「看文作畫」。很多人看到此條新聞驚呼人工智慧技術已經能「讀懂」圖片!
  • 強化學習走出研究實驗室,微軟如何落地新型AI解決方案?
    微軟的其他客戶和合作夥伴正在使用強化學習技術來檢測生產異常,因為該模型能夠從環境線索、專家反饋或客戶行為中學習,所以依據此可以開發出能夠適應不可預測的現實環境的機器人。微軟在其主頁上使用Personalizer來根據上下文對每個訪問者展示的產品進行個性化處理後,發現Personalizer所選擇的產品的參與度增加了19倍。
  • 『AI翻車』事件已超1000+,特斯拉,微軟、谷歌、蘋果等全部...
    https://incidentdatabase.ai/在這些事故中,有的可能只是鬧了個笑話,但有的已經對人類造成了實質性的傷害,或者為國家完全埋下了隱患。「殺手」機器人機器人是AI頻繁發生翻車事故的第二大領域。從列表來看,機器人在醫療、倉儲物流、、等多個場景中均發生過負面事故。例如:2018年,亞馬遜新澤西倉庫的一個自動機器人意外刺穿了驅蚊噴霧罐,導致25名工人被火速送往醫院。
  • 最適合企業入門的十大聊天機器人平臺推薦
    它配備了熱詞檢測(無需網際網路),語義分析,自然語言理解,會話引擎(多輪支持)以及神經網絡驅動的機器學習模型。它提供了一個可用於拖放界面的功能和工具庫。KITT.AI支持一系列用例,包括家庭自動化和商業用途,並且可以輕鬆地與網絡和行動應用程式集成。它提供了一套完整的工具,可用於為企業構建獨立的聊天機器人。
  • 微軟小冰首席科學家武威解讀 EMNLP 論文:聊天機器人的深度學習模型
    近日,在雷鋒網 AI 研習社公開課上,微軟小冰首席科學家武威就為大家帶來了其在 EMNLP 大會上分享的精華部分。公開課回放視頻網址:http://www.mooc.ai/open/course/606?
  • 好未來勵步英語發布3.0完整學習產品,推出AI智能學習機器人
    據介紹,圍繞線上線下、愛與科技、語言素養三點,對幼兒和小學課程體系與教材全面升級,該3.0產品採取1+6的完整學習路徑,即線下專注語言體系化學習+線上課前導學視頻預習、課後智能互動練習、AI外教互動課輔助理解、RAZ&ORT在線閱讀應用、豐富學習資源浸泡、小步機器人提供AI外教語伴,形成線上+線下的完整學習閉環。
  • 36氪首發 | 提供企業級深層語言理解技術,「薄言RSVP.ai」完成千萬...
    36氪獲悉,人工智慧科技公司薄言RSVP.ai完成千萬美元A+輪融資,由深創投領投。本輪融資後,薄言將在AI自然語言理解領域深耕,推進對話機器人和深度學習的應用落地。薄言是一家發展機器學習技術,提供企業級深層語言理解技術的AI公司。
  • 微軟將推AI繪圖技術drawing bot:說啥畫啥
    據外媒TechCrunch報導,近日 微軟 對外宣稱,正計劃推出一項新的人工智慧技術——繪圖機器人(drawing bot)。  微軟drawing bot技術中,用戶只需要說出想要繪製物體的名稱,機器人便可進行相關素材的匹配,從而生成理想的「物品草圖」。也就是說,未來可以通過口述的方式進行繪畫,你說啥它就畫啥。
  • 央視3·15曝光的AI機器人推銷電話公司 採用了什麼核心技術?
    比如,能夠回應助詞"emm"、「uha」等、理解上下文的對話內容,具備了主動提供語料的功能。當然,谷歌也不是世界上唯一一家實現這種神奇「功效」的企業。隨後,微軟也站了出來,發布了一項技術聲明:全雙工語音技術(Full Duplex)的意義在於,它能夠使「人機互動」進化為「人機交流」。一字之差,價值巨大。
  • 谷歌AI吵起來了!你才是機器人,你全家都是機器人
    然而和阿法狗的「兇殘」不同,在國外遊戲直播平臺Twitch上,兩個「小學生」人工智慧正在漫無目的地「思考人生」,甚至就「到底誰是機器人」這件事吵了起來。V:「因為你只是一個機器,你沒有真正的感覺。」E:「不,你才是機器。」V:「你才是。」E:「不!你是一個機器人!我是一個人類!就像創造出你的那個人一樣。」V:「不對,你是機器人而我是人類。你是一個叫Cleverbot的機器人。」E:「你不是人類。每個人類對於生命的意義都會有些概念。」