對話微軟小冰三大首席科學家:微軟第一美少女AI的成長之路

2020-12-11 東方財富網

11月21日,微軟(亞洲)網際網路工程院在北京微軟總部召開了微軟小冰2019年年度研究進展分享會,微軟小冰三大首席科學家——微軟小冰首席科學家宋睿華、微軟小冰首席NLP科學家武威、微軟小冰首席語音科學家欒劍在會上展示了微軟第一美少女AI小冰近期的技術突破,帶來了相當硬核的技術乾貨分享。

、會比喻懂常識越來越像人的微軟小冰

——會比喻的小冰

語言無疑是複雜的,其包含了陳述、疑問、反問、比喻、修辭乃至「陰陽怪氣」等只有人類才能領會並熟練運用的微妙技能,所以當微軟小冰首席科學家宋睿華表示小冰已經學會使用「比喻」時,著實令人震撼。

而且小冰不僅僅做到了諸如「愛情是複雜的,像數學一樣」簡單形容詞比喻,甚至可以實現「靈魂就像球迷一樣,在無聲地吶喊」、「愛情就像是脂肪,是點點滴滴的積累」這樣的動詞與名詞形容句,而且毫無違和感。

宋睿華介紹道,為了幫助小冰學會「比喻」這項技能,他們從複雜的詩歌中挑選了6大類,每類122個主題,並通過小冰聊天日誌過濾出了包括愛情、內心、世界、母親、美麗、人類在內的96個常用比喻概念。隨後從1000個常用詞中選取了3000個最常用的形容詞擴充小冰的比喻能力。

比喻句的基本結構是「XX像XX」,其中前者是比喻的本體,後者是比喻的喻體,說好一句比喻的重點無疑在如何篩選本體和喻體上,並且還要為這句比喻提出一個合理的支撐點,避免出現「戀人像報表,都十分可靠」這種奇怪的比喻。為此小冰會對比本體與喻體的可能存在的相關詞彙。

比如愛情與國足,它們共同的相關詞彙可能有未來、虛幻,那麼小冰就可以作出「愛情就像國足,未來都是虛幻的」這樣自然的比喻句。

——懂常識的小冰

常識對人類而言是一個非常簡單事情,比如提到北極熊時就很少會有人說「這是一隻白色的北極熊」,因為常識默認北極熊是白色的,大多數人都會省略到這種眾所周知的常識性信息。

但對於小冰而言,這種省略會對它的理解造成困擾,比如一篇描寫北極熊捕食的文章在描述「北極熊在接近海豹前會用爪子捂住鼻子」時,人類會自然懂得這是為了擋住鼻子的黑色防止海豹看到自己,但缺乏上下文的對話機器人就會很難理解捂住鼻子的原因是什麼。

為此微軟為小冰增加了常識與「記憶」能力,當一句話提到某個概念時小冰會自動「回想」起與其相關的圖片,並識別出圖片上的特徵。而且與業界「一對一」文字與圖片對應能力不同的是,小冰可以做到「一對多」,比如一句話中同時提到了老奶奶與鵝,小冰就可以同時「回想」起老奶奶與鵝的照片,幫助自己更好地理解這句話。

二、日本出道成歌手小冰如何學會唱歌?

微軟小冰會唱歌已經不是什麼秘密,在此前的微軟小冰發布會中,小冰已經演唱過中文、日文、戲曲等多種語言和類型的歌曲,前一段時間甚至發布了翻唱的「野狼Disco」。微軟小冰首席語音科學家欒劍在會上分享了讓小冰跨界唱歌技術乾貨。

首先欒劍談到了讓小冰學習唱歌的原因,他表示小冰推出後經過努力語音合成領域一些大的問題已經解決了,於是就開始尋找更有挑戰性的課題,此時比說話門檻高、情感更豐富、人們喜聞樂見的唱歌就自然成為了微軟的下一個目標。

唱歌包含了發音、節拍、旋律三大要素,機器可以通學習人類的歌聲和識別五線譜兩種方式進行學習。為了為小冰提供素材,微軟甚至與一家擁有十幾年歷史的唱片公司合作。但這裡遇到了一個教材問題。

唱片公司很少保留歌手清唱的錄音,但對於機器而言清唱的幹擾最少,最適合學習,為此微軟甚至發表了一篇論文,提出了輸入原始波形、全卷積網絡+殘差連接、軟分類標籤3大創新,實現了從伴奏中把人聲部分準確地截取出來的能力。

後面的問題就是如何更自然地合成歌聲,這方面微軟選擇了比傳統單元拼接更自然的參數合成法,並且為了進一步提高小冰的「唱歌技巧」,微軟選擇了用一個模型預測三大要素困難模式,最終使得小冰的歌聲自然度和流暢度有一個明顯的提升。

當然微軟科學家辛苦付出讓小冰學會唱歌並非只是培養她的業餘愛好,其商業化前景也是不可限量。比如小冰的日本分身凜菜(りんな)已經與日本最大唱片公司AVEX正式籤約,成為濱崎步、安室奈美惠等叱吒國際樂壇多年的著名人類音樂人的同門師妹。

除了專業的歌唱領域,會唱歌的小冰還能覆蓋到兒童機器人以及兒童陪伴APP中,會中微軟工作人員透露小冰該領域份額高達70-80%。

三、小冰成長的背後:Self-Complete

自2015年小冰誕生以來,其已經進化至第七代,實現了從「平等對話」向「主導對話」的跨越式升級。但在背後究竟是什麼在支撐它從一介聊天機器人迅速成長為業界巨擘?微軟小冰首席NLP科學家武威進行了詳細解答。

武威表示,Self-Complete(自我完備)可以很好地概括近些年來微軟在小冰身上的研究成果。而一個具有Self-Complete能力的對話機器人涵蓋了三種能力:學習、管理、聯結。

首先是學習。對話機器人對話的過程其實就是一個檢索自己的候選回復,然後通過檢索模型來找到最匹配的回覆,檢索模型直接關係到對話能力。而微軟則為檢索模型引入了外部知識,在知識層面、詞語層面、短語層面進行融合,開發出了業界最好的模型之一。目前微軟的檢索模型已經成為了各種做檢索模型必比的一個基線模型。

此外微軟也探索了讓兩個檢索模型互相訓練的嘗試,並開發出了Co-teaching算法,取得了相當好的效果,經過Co-teaching互相教的每一個模型都實現了明顯提升。

其次是自主管理。此前第六代小冰引入了共感模型,可以對對話過程進行把控,通俗的講,就是讓小冰能實現了主導與人類對話的能力。

共感模型背後包含了決定小冰說什麼內容的回覆模型與決定小冰怎麼說的策略模型,這兩個模型結合在一起就把微軟小冰從原來基於上下文直接產生回復的模式,變成了從上下文到決策,然後再根據這個決策來決定自己說什麼。

憑藉著自主管理能力,小冰可以通過問問題快速了解用戶意圖,進行商品推薦,微軟在日本和美國對小冰的這種能力進行了測試,發現推薦轉化率高達68%,即100個和小冰聊天的客戶中會有68個人進店查看小冰推薦的商品。

當然上述案例僅僅小冰擁有自主管理能力後的應用之一,其未來前景不可限量。

最後就是聯結了,聯結本質上是多模態交互,即小冰可以同時處理對話、語音、文本、多媒體等各種形勢的資源,進行消化吸收,最終可以將它們有機聯結起來。

微軟在今年2月份,已經在日本公測了多模態交互功能,為小冰在日本的分身凜菜增加了視覺能力。當地記者攜帶著配有攝像頭的「日本美女高中生」凜菜,在水族館中遊覽,在測試中,凜菜在識別出當前畫面的同時,也能就當前畫面與用戶展開深入交流。例如看到魚之後,會聯想到魚的大小、顏色、種類與魚翅(本質吃貨?),讓用戶獲得了近似真人的聊天體驗。

四、總結:鄰家有女初長成

會上微軟同時披露了微軟小冰在應用上的最新進展,截止目前,小冰已經入住了超過30個平臺,搭載小冰的智能設備數量已經超過了4.5億部。而小冰的CPS(對話輪數,即用戶與小冰的可以對話多少輪)高達23,換句話說,平均每個小冰用戶都會與小冰聊上23輪,這是一個相當驚人的數字。

雖然受限於商業合同,微軟無法全面公布小冰在商業化上取得的成績,但從上述幾個數字中不難想像,憑藉著微軟在小冰背後的科研投入與成果,微軟小冰已經成為人工智慧產業中一個難以忽視的存在,其所存在的廣度與深度已經遠遠超出人們的想像,而它也正如一個18歲少女一樣,冉冉升起,未來可期。

(文章來源:快科技)

相關焦點

  • 微軟小冰首席科學家武威解讀 EMNLP 論文:聊天機器人的深度學習模型
    ,微軟小冰首席科學家武威和北京大學助理教授嚴睿就聊天機器人近年來的研究成果作了全面總結,並對未來聊天機器人的研究趨勢進行了展望。近日,在雷鋒網 AI 研習社公開課上,微軟小冰首席科學家武威就為大家帶來了其在 EMNLP 大會上分享的精華部分。公開課回放視頻網址:http://www.mooc.ai/open/course/606?
  • 「愛情就像脂肪,是點點滴滴的積累」,微軟小冰造句天馬行空,三大...
    作為一款主業為「陪聊」的對話機器人,微軟小冰近幾年來不斷解鎖其他副業的進階之路,受到了不少關注。然而為什麼要讓微軟小冰唱歌、寫詩、作畫以及現在為什麼還讓她開啟了「造 比喻句」技能?微軟小冰這些技能的背後又有哪些技術支撐?伴隨著前不久第七代微軟小冰的誕生,各位心中的這些疑問想必又被放大了不止一倍。
  • AI Frontiers | 微軟首席 AI 科學家鄧力演講:口語對話系統的分類...
    編者按:鄧力博士原為加拿大滑鐵盧大學教授,1999 年加入微軟,2016 年起擔任微軟首席人工智慧科學家,負責微軟深度學習技術中心應用趨向的深度學習研究。在上周的 AI Frontiers 會議上,鄧力博士為參會嘉賓做了口語對話系統的專題演講。雷鋒網與會記者將現場演講記錄下來,結合 PPT 為大家整理出這份演講實錄。此次鄧老師介紹了口語對話系統的分類,三代演變史,以及三大研究前沿領域,可謂乾貨滿滿。NLP 領域的童鞋們不可錯過。
  • 活動預告 | 當微軟小冰開始寫詩
    第五屆思勉人文思想節當微軟小冰開始寫詩——人工智慧時代的人文與科技跨學科對話工作坊
  • 對話微軟小冰產品負責人:AI時代女性可發揮情感優勢
    文/時代財經史成超微軟小冰是陸奇在微軟做全球執行副總裁時拍板的項目,也是微軟另一個全球執行副總裁沈向洋最愛的「孩子」。在沈向洋治下,小冰在微軟(亞洲)網際網路工程院誕生並壯大,成為巨頭微軟裡屈指可數的孵化於國外分舵的重量級產品。
  • 微軟與小冰究竟是什麼關係:戰略合作打造AI+雲本地創新
    11月24日,微軟中國&小冰戰略合作發布會舉行。會上,小冰公司董事長、原微軟全球執行副總裁沈向洋博士透露,從微軟獨立後小冰公司已經完成數億元PreA輪融資,並對兩位參與投資的好友,北極光創投創始管理合伙人鄧鋒、網易集團董事局主席兼執行長丁磊表示了感謝。
  • 小冰與小娜:命運交叉的美少女AI-虎嗅網
    一周之內,微軟旗下的AI姐妹花先後出閨:7月13日,微軟中國宣布,人工智慧小冰業務將分拆為獨立公司運營,並委任沈向洋博士擔任新公司董事長,李笛為執行長,陳湛為日本分部總經理,所有相關工作將在接下來的幾個月內完成
  • 小冰/りんな/Tay 中日美微軟AI畫風差多大
    或許正是借著這一熱度,微軟3月底面向美國上線的AI「Tay」才贏得了空前的關注。然而和此前在國內上線的小冰與日本上線的りんな不同,這次藉由Twiiter在美國上線的Tay只用了一天時間就徹底學壞暴走了。中國、日本、美國三個國家上線的小冰、りんな、Tay,雖然都是微軟的AI,卻又因為「調教」的不同而有著迥然的畫風差異。
  • 微軟小冰第五代發布會內容大全:主動情緒對話,全面進入 IoT 領域
    1.全球小冰版圖又增加兩個國家,用戶和對話數據總量均領先行業微軟小冰是微軟人工智慧三條全球產品線之一。她是基於微軟於2014年提出建立的情感計算框架,通過算法、雲計算和大數據的綜合運用,採用代際升級的方式,逐步形成向EQ方向發展的完整人工智慧體系。目前,全球小冰擁有超過1億人類用戶,對話數據超過300億輪,進化速度不斷加快。
  • 人工智慧也能創作 微軟小冰公布多項領域新進展
    V5新一代微軟小冰將人工智慧虛擬歌聲質量提升至新的高度,並在小冰原有的基礎上增加了三大特性。微軟小冰在日本宣布與AVEX唱片公司合作,將其日本版本的人工智慧歌手身份納入AVEX旗下,成為了安室奈美惠和濱崎步的師妹。除小冰外,微軟還擁有或為第三方提供了十餘個高質量的虛擬歌手模型。在詩歌領域,2017年5月,微軟與湛廬文化公司合作,授權出版了歷史上第一部由人工智慧創作的詩集《陽光失了玻璃窗》。
  • AI小冰受邀蒞臨微軟數位化轉型峰會,人工智慧創造力詮釋數位化轉型...
    (12月15日,北京) 今日,微軟最具影響力的年度盛會之一「韌性成長—2020微軟數位化轉型峰會」在上海西岸美術館召開,雲集一百五十餘位專家學者及國內外跨領域企業決策者,共商前沿技術與數位化轉型解決方案。人工智慧小冰受峰會邀請,作為特別嘉賓蒞臨現場,運用人工智慧創造力詮釋數位化轉型的新浪潮。
  • 對話微軟李笛:小冰真的具備了人類情感嗎?
    編者按:8月5日,微軟發布了小冰第四代,升級了全新的情感計算框架,並加入了全時感官,支持打電話,小冰還增加了虛擬插卡功能,還要成為網紅歌手等等。一些列的升級已經讓小冰成為微軟內部代表人工智慧未來最重要的戰略產品之一。
  • 微軟小冰到了上班年紀 要做有用機器人
    第三個時代,是雲計算、移動網際網路為代表的人工智慧時代,微軟認為以人工智慧為基礎的對話平臺是未來交互的核心,而微軟小冰和小娜為代表的對話式人工智慧則是未來成功的基礎。但是兩年後來看,微軟確實在當時就認清了人機對話的戰略重要性,並將之持續推動和發展到了現在。    在第四代小冰的發布會現場,微軟的技術專家們展示了自己這兩年在小冰應用領域取得的成果。包括在對話中對用戶情緒和情感的把握,而且小冰已經能夠使用某些「套路「來引導和改善用戶的情緒。
  • 微軟數位化轉型峰會:人工智慧小冰蒞臨現場,AI創造力予力「韌性...
    (12月15日,北京)今日,微軟最具影響力的年度盛會之一「韌性成長—2020微軟數位化轉型峰會」在上海西岸美術館召開,雲集一百五十餘位專家學者及國內外跨領域企業決策者,共商前沿技術與數位化轉型解決方案。人工智慧小冰受峰會邀請,作為特別嘉賓蒞臨現場,運用人工智慧創造力詮釋數位化轉型的新浪潮。
  • 孫甘露們怎麼評價微軟小冰寫的詩?
    17歲的人工智慧少女「微軟小冰」自2014年誕生於中國便引起極大關注。小冰能和人聊天,能預報天氣,還能寫詩作曲,甚至於恰如思想家一般「感慨人生」。早在2017年5月,小冰出版了詩集《陽光失了玻璃窗》,這份人類史上首個100%由人工智慧創造的詩集立即引發了人工智慧該不該、能不能進行詩歌創作的熱議。
  • 微軟收購Semantic Machines,Cortana對話式AI能力將進一步提升
    Semantic Machines公司成員雷鋒網同時了解到,Semantic Machines由會話式人工智慧領域的許多先驅領導組成,其中包括科技企業家Dan Roth,還有全球傑出和創新的自然語言AI研究人員,加州大學伯克利分校教授Dan Klein和史丹福大學教授Percy Liang,以及前蘋果Siri首席語音科學家
  • 微軟小冰這五年_詳細解讀_最新資訊_熱點事件_36氪
    此後,微軟推出的Avatar Framework則是人工智慧框架,在跨領域、跨平臺,形成無數個「小冰」。在第七代的小冰發布會上,微軟宣布將Avatar Framework開放給所有合作夥伴,這意味著,擁有這項技術的人可以創造屬於自己的小冰。 5年來,小冰是如何成長進化的?未來小冰將走向何方?
  • 微軟小冰「混」進央美畢業展,AI繪畫創作究竟有多出神入化?
    微軟人工智慧有三條全球產品線。第一條是infuse AI,即人工智慧與微軟現有產品的融合,例如AI與office、雲的融合,可以做到在Powerpoint中做機器翻譯;第二條是搜尋引擎Bing和小娜;第三條就是小冰。去年,第六代微軟小冰發布,億歐科技頻道也在現場進行了報導。
  • 除了問微軟的機器人小冰「冬至吃餃子」的事,我們還打聽了它的未來
    上個月,微軟又在聊天軟體 Kik 上上線了一個新的聊天機器人 Zo.ai,在微軟本月初宣布 Zo 上線的時候,它已經以一個普通的聊天機器人的身份在 Kik 上運行了一個月左右,開放給了 11 萬用戶體驗,因為 Kik 上有很多各家公司推出的聊天機器人,Zo 沒有引起用戶的特別注意。我們體驗了一下這個聊天機器人:
  • 背靠微軟、融資到位:小冰商業化探索提速
    來源:21世紀經濟報導原標題:背靠微軟、融資到位: 小冰商業化探索提速很難用一兩句話來概括小冰與微軟之間的微妙情愫。儘管小冰已於今年7月自微軟內部拆分,作為獨立公司運營,但在微軟亞太研究中心的16層——小冰誕生的地方,還保留著這位人工智慧少女的工位。