今日頭條機器人:對話、問答、新聞創作,人工智慧已無所不能了嗎?

2021-03-06 今日頭條


10月18日,今日頭條科學家、頭條實驗室總監李磊博士在世界人工智慧大會發表了題為「理解語言與妙筆生文的機器人」的演講,分享了人工智慧在自然語言理解方面的成果與挑戰。

以下是演講全文整理。

大家下午好!

很榮幸有機會在這裡和各位專家學者以及同行朋友們交流人工智慧在自然語言理解方面可以做到的一些成果。今天我會介紹一下用機器學習怎樣來做自然語言的理解,怎樣跟人對話、問答以及怎樣自動創作新聞;做到這些事情,我們需要哪些機器學習的工具,和哪些基礎的算法模塊;然後介紹三個方面,分別是對話機器人、問答機器人、自動創作新聞的機器人,具體是通過何種技術來實現的;最後介紹我們如何來實現通用的人工智慧,或者說目前的人工智慧技術還有哪些挑戰以及我的一些思考。


今年年初GOOGLE的DeepMind通過他們的圍棋機器人AlphaGO讓全世界幾乎所有的人都知道,機器學習可以在某些任務上達到甚至超過人類的智力水平。那圍棋的機器學習是怎樣來實現的?用了兩部分的算法,一部分深度學習,另一部分強化學習或者蒙特卡洛樹搜索。我後面介紹的內容與深度學習有關。從過去20年或者30年神經網絡以及深度學習發展的成功經驗裡都可以看到,深度學習解決一類問題是非常非常有效的,這一類問題是有監督學習。什麼叫有監督學習?就是你給一組數據X,希望對這組數據做一點預測,它是Y,你希望通過機器學習的方法找到從X到Y的映射函數f。


例如我們的輸入是一張圖片,我們的輸出是這張圖片的標記,它到底屬於哪個類別,是貓還是狗,這是圖像分類問題。如果我們的輸入是一句中文的語音,輸出是一句英文,那從中文到英文同樣是一個有監督的學習或者叫機器翻譯。第三個例子,我們給一個圖片,我們希望生成一段文字來描述這個圖片。大家知道我們小的時候會做看圖說話,是不是機器也可以做看圖說話?同樣,這就可以把它建模成一個有監督學習的問題。第四,輸入是一段語音,輸出是這段語音對應的文字,這個叫語音識別,同樣是有監督學習的問題。當然可以把這個問題反過來,輸入是一段文字,輸出是一段語音,這就是語音合成,同樣是一個有監督學習。深度學習在解決這樣一類有監督學習的問題時,只要數據充分、模型合適,可以做到非常好。

那麼深度學習究竟是如何來做的?深度學習或者人工神經網絡最早是從人腦的工作方式得到啟發。人腦由非常非常多的神經元組成,每個神經原元都只可以做非常簡單的事情,但把這些神經元連接起來就可以做一些比較複雜的事情。


從這裡得到啟發,我們的人工智慧先驅創作了人工神經元。人工神經元同樣有一些輸入,這個輸入經過非常簡單的方式加權求和,通過非線性的函數輸出一些結果,把很多個這樣的神經元組合起來,就可以做一些複雜的事情。


比如說輸入是一張圖片,要識別這個圖片裡面帶有的數字。這裡展示一個單隱層的神經網絡。當然也可以增加這個隱層的數量,可以把網絡的識別能力不斷提升。


這些深度學習跟今日頭條有什麼關係?今日頭條是一家為用戶提供信息資訊的分享閱讀平臺。整個環節當中有三部分非常重要,包括高質量的內容怎麼創作出來,這些內容怎樣分發給感興趣的用戶、讀者讀了這些文章、看了這些視頻之後怎樣去鼓勵他們圍繞這些內容進行討論和交流。這三方面的核心技術都需要人工智慧。


我今天會介紹這三個方面中的兩方面,包括內容創作以及內容討論——我們怎樣做機器人來跟人去討論以及做機器人自動創作。

我們要處理的問題主要是語言問題,和之前講的圖象問題有很大的區別,圖象的輸入是固定大小的,而語言的問題就比較複雜,一句話可長可短。這樣帶來一個問題,怎樣處理變長的輸入。我們創作的深度學習模型最基礎的就是要能夠處理可變長的輸入,最基本的想法就是增加記憶單元。在這個模型裡面有一些單元專門負責記錄歷史信息,它能夠記住較長時間內的信息,對未來做預測。


▲循環神經網絡(Recurrent Neural Networks)

比如說這裡有一個非常簡單的循環神經網絡模型,它的輸入是X1、X2、X3、X4,每個輸入都是一個向量,和傳統卷積神經網絡不同的地方就是它的輸出部分或者影像量的那部分,h在這裡,每個h不僅跟當前的位置輸入有關,還跟前面一個輸入有關,這樣可以把歷史信息結合進來,這是最簡單的形式。還有稍微複雜的一個形式叫Gated Recurrent Unit(GRU),像人腦學習加入了一些開關,可以選擇性對信息做記憶和遺忘。比如加入了一個開關叫Reset Gate,對信息做選擇性記憶,另外還有一個開關控制輸出,可以控制哪些部分是之前一個時刻之前一個位置留下來的信息,哪些信息需要保留到下一個位置。


通過這些帶有記憶單元的神經網絡,就可以構建出自動對話的機器人。比如說這裡我展示了一部分我們的機器人可以做的對話。


我們的機器人不僅可以跟人閒聊,還可以對用戶說的一些新聞做出帶有感情色彩的評判,甚至我們的機器人對於很長很長的輸入,也可以做出比較準確的回應。這裡有一段很有名的電影臺詞,機器也可以很好的回應。


到底怎麼生成這些對話中的回應?這裡有一個簡單的演示:從循環神經網絡出發,給它一個初始狀態,黃色的部分是它的初始狀態,從這個初始狀態出發生成下一個狀態,從當前隱含的信息出發可以去預測出當前這個位置需要輸出哪個文字。有了文字之後,我們再把這個文字信息作為下一個字需要輸入的需要信息輸入進去,綜合起來從第一個字生成第二個字生成第三個字生成第四個字,直到生成句子結束為止。


剛才說的是對話,如果沒有上句的輸入比較簡單,如果有上句的輸入,怎麼生成合理回應?同樣用循環神經網絡,會對前一句來建模,把上句輸入的每個字變成一個向量,把這個向量綜合起來處理,最後整句話變成一個向量表示,這個向量就作為我們下句生成回應的循環神經網絡的輸入,再用前一頁講到的方法來生成第一個字第二個字第三個字,通過這樣的方式來生成。


我之前還提到,我們的機器人不僅能夠生成這樣的對話,它還能夠帶有感情色彩,那感情色彩是怎樣出現的?我們對這個模型加入了額外的激勵,這個額外的激勵就是情感激勵。我們希望這個對話是高興的、開心的或者憤怒的或者悲傷的,我們可以給它加上額外的激勵,這個額外激勵加上去之後,它生成的內容就會帶有特定的感情色彩。剛才提到的還只是會閒聊的機器人,但他也不能夠回答一些帶有知識性的問題。

第二個我要講的是怎麼樣來做一個模型,讓它能夠回答一些知識類的問題。知識如何表示才能讓計算機理解,我們需要表示成結構化的方式。例如圍繞貝克漢姆這個人物,把知識表示成圖,圖裡面每個結點是一個實體,實體之間、結點之間有一些邊相連,這些邊代表了關係。比如說貝克漢姆的出生地是Leytonstone,我們把這些知識表達成三元組的形式,有它的主體、關係以及客體構成。


機器怎樣自動回答問題?要問貝克漢姆是在哪裡出生的,為了回答這個問題,我們就要從知識庫裡面找到相應的三元組知識,這條知識是<DavidBeckham, PlaceOfBirth, Leytonstone>,從而找出答案Leytonston。為什麼讓電腦回答這樣的問題非常非常難?首先我們的語言是非常複雜的,同樣一個意思可以有多種問法。比如我們可以問歐巴馬總統在哪裡出生的?也可以問歐巴馬總統出生地是哪裡。同樣的意思但有不同的問法,這是語言的多樣性和複雜性。第二個難點是歧義,同樣的名字在我們的知識庫裡面會有很多個實體很有同樣的名字,比如我們問麥可喬丹是誰,可能大家首先想到的是打籃球的麥可喬丹,但問機器學習領域的人會想到機器學習的大神麥可喬丹。這是指代的歧義性帶來的挑戰。第三個難點是由我們的數據稀疏性所帶來。我們的知識海量,即使經過我們的三元組篩選之後也有2200萬,這是在GOOGLE的FreeBase上得到的數據。我們一共有十萬標註好的問答對,但要通過十萬的標註數據回答2200萬裡面的問題,這是一個非常難的問題。

最近我們做了一個CFO系統,是一個基於深度學習的系統,它可以回答一些比較難的問題。比如說問Harry Potter在哪裡上的學?大家知道Hogwarts魔法學校,還有上魔法學校之前的一個小學不是很多人知道,但是機器可以回答出來。通過我們的評測,在由Facebook做的公開數據集上,我們的系統準確率達到了75.7%,相對之前由Facebook做的最好系統最好的結果是62.9%,也就是說我們已經比之前最好的系統要高了十幾個百分點。這是怎麼實現的?如何來做問答機器人?


舉個例子,拿到一個問題,Who created the character Harry Potter。首先要識別這個問題裡面的關鍵實體是哪個。Harry Potter。第二步,識別這個問題問的究竟是什麼樣的關係,Character_Created_By,找到了這兩個才能從知識庫裡面找到相應的答案。


我們通過序列標註的深度學習模型來對各種可能的實體打分,通過我們的模型就會發現David beckham問到的實體概率最大。我們通過另外一個類似的模型,這個模型裡面有雙向的循環神經網絡,通過疊加多層的雙向循環神經網絡對我們的輸入問題建模,最後對這個向量來預測到底實體庫裡面哪個實體跟這個問句是對應的,哪個關係跟這個問句是對應的。最後會發現這個問題問的實體是Harry Potter,這樣把實體找出來,把答案也找出來。


剛才講的是問答的機器人,最後要講的是可以自動寫新聞的機器人,名叫XiaomingBot。在奧運會之前開發的機器人,16天的時間寫了450篇新聞,圍繞桌球、羽毛球、足球、網球四個類別寫 。在短短16天內,讀者總計一百萬。後面通過數據分析發現,在同一時間由專業體育記者所寫的體育新聞閱讀率和XiaomingBot寫出的新聞閱讀率差不多,甚至XiaomingBot新聞閱讀率會更高一些。XiaomingBot既可以成比較短訊,也可以生成比較長的文章。比如女足的新聞比較長,描述的比賽過程比較詳細。相對之前研究的新聞機器人來對比,我們的XiaomingBot有一些不同的特點:比如說我們非常快,XiaomingBot在比賽結束的兩秒鐘之內就可以從生成到發布到讀者讀到,整個過程時間非常短,從創作到分發到自動推薦整個流程全都是機器來完成的,這也是我們今日頭條這個平臺的優勢。第二個特點是短長結合,既可以生成短內容,也可以形成長報導。另外XiaomingBot可以圖文結合,實時加上一些比賽的圖片,而且我們對比賽的描述符合比賽的時間線,尤其對於足球比賽的描述。我們的生成結合了文法生成技術以及機器學習,內容讀起來更像是專業記者所寫。


對話、問答、新聞生成的機器人,是不是我們的機器人已經無所不能?不是。那現在機器人還有哪些不足,還有哪些做不到?通過對話機器人非常容易發現,我們說一些話會讓機器人前言不搭後語;而我們的問答機器人雖然可以在知識類的問題上達到75.7%的準確率,但是它還不能處理更通用的問題,比如除了知識類以外,我們還有問原理性的、問步驟性的、以及問深度解釋類的問題。如果你問他人生的意義是什麼,很難回答你。我們對體育類的新聞生成是比較好的,但是如果把它推廣到所有品類做成非常通用的文本生成機器人還是有很長的路要走。為什麼機器人會有這些局限?首先一開始提到深度學習或者機器學習在解決有監督學習的問題是非常非常有效的,但是同時它的有效也帶來局限。它的有效是因為現在有大量的數據有複雜的模型,但恰恰是因為需要大量的數據,這對目前深度學習方法造成了一個很大局限,就是需要非常大的標註好的數據,而通常標註這些數據所需要的代價是非常非常大的。

其次,局限還在於通用性或者可擴展性。我們的問答機器人可以回答知識類問題,但很難再去回答其它的問題,這就是通用性和可擴展性的局限。怎麼實現通用的人工智慧或者說實現通用人工智慧我們還有哪些問題哪些大的挑戰需要去解決?這裡分享三個需要我們人工智慧學者、機器學習專家去研究的技術問題。

第一個問題,機器學習模型的可解釋性,深度學習模型在很多問題上做得非常好,可是有時候我們會發現模型做得好,但其實並不知道它為什麼做得好。或者我們的模型犯錯了,但我們並不知道它為什麼犯錯,這就是可解釋性的問題。我們的機器學習還需要更多地去研究一些模型一些方法,讓它能夠對自己的行為做一些預測和分析、解釋,當它做得不好的時候,它知道自己為什麼做得不好,就像人一樣,能夠分析自己的錯誤。這是第一點。

第二個問題,推理能力。應該能夠更多的跟周圍環境當中的物體去交互去推理,我們的機器學習目前做的離推理稍微有點遠,還只能做非常簡單的判別,比如說判別一個類別。但更複雜的推理實際上還是比較難的,所以我們還需要在這方面做更多的突破。

第三個問題,是我們之前可能忽略的。目前的研究更多的在關注模型、性能和準確率,但是我們並沒有注意這些超過人類的智能,達到比人水平還要高的圍棋機器人,實際需要非常非常多的計算資源,幾千臺機器,需要消耗非常多的能源。我們未來更好的算法是不是能夠在最少的能耗情況下去達到更高的智能。以上就是我的分享。

謝謝大家!

長按二維碼,勾搭頭條君

你關心的,才是頭條丨今日頭條

相關焦點

  • 新聞寫作機器人的應用及前景展望——以今日頭條新聞機器人張小明...
    摘要:在裡約奧運會上,今日頭條的一個名叫「張小明」的新聞機器人讓讀者眼前一亮。2秒鐘寫稿,擬人化語言,智能配圖......近些年來,人工智慧在新聞領域的應用越來越頻繁,不少人驚呼連記者這個行業都要被機器化了麼?
  • 一年賣近100億廣告的今日頭條是怎麼做生意的?
    根據數據服務商QuestMobile的數據,移動應用中人均月度使用時長的前2名的一個是微信,另一個就是今日頭條。今日頭條作為一個成立四年的網際網路公司,發展還是挺快的。主要競爭力是什麼呢?今日頭條利用人工智慧推薦算法提升了信息分發效率。最開始的兩年,別人認為我們就是又一個新聞客戶端,沒有足夠的重視。而現在,整個行業都被我們帶到了算法智能分發的這條路上。
  • 經濟學人:中國新聞APP今日頭條上了新聞頭條
    8月有傳言稱中國在線搜尋引擎百度將收購新聞聚合平臺今日頭條。頭條作出了譏諷的回應稱,傳言把買家和賣家弄反了。頭條的這種驕傲是有根據的。自2012年成立以來,今日頭條的增長速度驚人。據稱,已有7億用戶訂閱了頭條app的個性化新聞推送。最近的一輪融資後,其估值已經高達220億美元(如下圖)。今日頭條母公司北京字節跳動科技有限公司現在真成了買家。
  • 機器人搞不出大新聞
    時任第一財經首席數據科學家湯開智,曾公開暢想了寫作機器人的更高階進化形態:DT稿王會對接商業寫作場景,並將變成開放式寫作工具,最終遍成具有商業目的的自由寫作助手。[8] 大網際網路公司如字節有今日頭條、騰訊有騰訊網、阿里有第一財經,幾家公司不缺平臺,也不吝傾斜流量,AI寫作機器人在各自的平臺裡可以形成正循環。
  • 新聞背景:今日頭條創作者大會
    2015年,今日頭條首次舉辦「頭條號創作者大會」,公布了頭條號平臺未來前進的方向,並發布「千人萬元」計劃,讓 1000 個頭條號每月至少獲得 10000 元固定收入。2016年第二屆「頭條號創作者大會」上,我們宣布將投入10億元補貼短視頻創作者。一年過去,短視頻已成為當下內容創業最強風口。
  • 對話機器人技術簡介:問答系統、對話系統與聊天機器人
    自從iPhone 4S開始內置Siri,到現在各種智能音箱,或者扎克伯格說自己做的智能管家,我認為都算是對話機器人的一類。以蘋果的Siri和亞馬遜的Echo為例,它實際上是一套非常複雜的智能系統,而對話機器人是其中一個界面。有些文獻或者商業機構把這部分稱為Conversational UI(對話界面),也就是說我們通過對話來與機器溝通。
  • 【人機對話】對話機器人技術簡介:問答系統、對話系統與聊天機器人
    自從iPhone 4S開始內置Siri,到現在各種智能音箱,或者扎克伯格說自己做的智能管家,我認為都算是對話機器人的一類。以蘋果的Siri和亞馬遜的Echo為例,它實際上是一套非常複雜的智能系統,而對話機器人是其中一個界面。有些文獻或者商業機構把這部分稱為Conversational UI(對話界面),也就是說我們通過對話來與機器溝通。
  • 人工智慧勢如破竹,開創機器人對話時代 | Q推薦
    尤其是自然語言處理技術的進步,讓「另一個自己」有了更具象的呈現,嵌智能對話機器人功能是未來產品發展的重要趨勢。但對於企業和開發者來說,從零開始進行任何一種人工智慧開發都非易事,不僅需要大量數學、深度學習、機器學習、特徵過程等知識技能成本,還要經歷數據標註、模型訓練、部署上線等諸多環節的調試,需要投入比其他智能技術更多的精力和成本,可謂困難重重。
  • 阿里巴巴、今日頭條聯合發布2018科技趨勢預測15位科學家「預言...
    未來真的會有能像人一樣思考和對話的機器人嗎?量子計算機的出現,會不會重構世界科技、經濟、政治格局?未來變幻莫測,但至少我們可以嘗試以更高的視角,重新審視由科技創造的世界。李航今日頭條人工智慧實驗室總監2018年NLP(自然語言處理)將在翻譯、問答、對話等幾個方面繼續取得巨大進步。大膽預測,未來一年對話系統將能更好地理解人類語言,更自然地與人類通過語言交互。對話方面令人震撼的突破可能來自以下幾個場景。
  • 淺析今日頭條產品矩陣
    相信不少人都會回答:「今日頭條是個性化推薦新聞的客戶端。」自2012年8月上線以來,用戶像自來水一樣源源不斷,一躍成為國民應用,小BAT之一,成為最能佔領GDT(國民總時間)的應用之一。這些年,今日頭條也發生了很大的變化,推出了不少家喻戶曉的新產品,不僅僅是之前的那個個性化推薦新聞客戶端了。
  • 人工智慧|李磊:機器人寫的文章與記者寫的閱讀率持平
    【編者按】2017年12月22日-24日,第七屆吳文俊人工智慧科學技術獎頒獎典禮暨2017中國人工智慧產業年會在蘇州舉行。今日頭條與北京大學共同完成的「網際網路信息摘要與機器寫稿關鍵技術及應用」項目榮獲吳文俊人工智慧技術發明獎。
  • 一個沒有邊界的今日頭條真的好嗎?
    從品牌、用戶獲取信息的成本、算法精準度等三個方面一一論證,一個沒有邊界的今日頭條真的好嗎?2012年8月一個叫今日頭條的APP發布了它的第一個版本。這個產品,我們似乎感覺不到它的邊界在哪裡,新聞、視頻、短圖文、問答,似乎可以在今日頭條這款app找到一切想要的內容。
  • 專訪北大計算機所萬小軍:寫稿機器人是新媒體時代的產物| CCF-GAIR...
    十幾年前,萬小軍就開始做自然語言處理,開始關注其在新聞上的應用,寫稿機器人並不是一個憑空跳出來的擁有華麗簡歷的神同事,而是技術不斷推進和媒體環境變化的產物。在雷鋒網(公眾號:雷鋒網)對萬小軍的專訪中,我們拋開人工智慧何時能超越人類, 機器人能不能自主思考這樣漫漫而談的終極話題,一起來看看這個專注於新聞領域的計算機教授究竟在做什麼。
  • 從產品體驗和問題建議淺談今日頭條
    slogan:你關心的才是頭條。產品願景:全球化的創作和交流平臺。頭條號在2018年全面升級後,支持圖文、短視頻、短內容、問答、小視頻等所有體裁創作,全平臺(今日頭條、西瓜視頻、抖音短視頻、火山小視頻、悟空問答)分發,產品粉絲數據也全面打通,多渠道漲粉,全平臺共享。現在打開任一平臺均可以看到不同平臺下的粉絲數:
  • 武漢晚報入駐今日頭條悟空問答
    本報訊(記者葉鳳)本月,武漢晚報正式入駐今日頭條「悟空問答」社區,通過回答網友的提問,幫助廣大網友更多地了解武漢、欣賞武漢,更好地享受在武漢的工作和生活
  • 頭條悟空問答怎麼開通收益?如何開通悟空收益
    對那些希望通過回答他人的問題而獲得收益的人來說,悟空問答是一個適合創作者成長的平臺。多數常逛頭條的小夥伴都知道,頭條裡有悟空問答的入口,而且通過在頭條上回答別人的問題而獲益良多。那2020悟空問答如何開啟盈利呢?跟小編一起來看看吧。
  • 今日頭條新CEO朱文佳:今日頭條的邊界是「一橫一豎」
    新京報訊(記者 白金蕾)今日頭條的邊界是什麼?從頭條號、短視頻,到問答、微頭條,直至近期的搜索,「邊界」這個詞對於今日頭條來說,似乎並不存在。在11月15日舉辦的生機大會上,上線7年的今日頭條首度公開了其產品邏輯,以「一橫一豎」概括過去歷年的演化:「一橫」是儘可能豐富的內容體裁,「一豎」是儘可能多的分發方式。
  • 今日頭條:人人都可以來,離開時也不會留戀
    5年的時間,張一鳴的今日頭條早已衝破了邊界的桎梏,從一開始的新聞客戶端,進化到後來的內容分發平臺,如今已是集社交、問答、視頻、信息分發於一身的龐然大物。一旁的程維和王興有異議:快是必要的,但太快,輪子會飛出去。兩人的背後矗立著估值已過千億的美團和滴滴,和今日頭條一樣,過去的五六年裡,他們用一種現象級的速度向外擴張,不斷打破邊界。
  • 今日頭條極速版下載賺錢_今日頭條極速版下載免費「最新版...
    你可以在今日頭條極速版下載免費找到了解世界、啟發思考、開懷一笑的熱點信息,並且還可以與網友們一起互動。今日頭條極速版手機版下載具有內存小、省流量、使用流暢等優勢,源源不斷地為你提供和傳遞有溫度有價值的新聞資訊,即時聚焦熱點新聞,只要您一鍵刷新即可觸達,各種有趣有價值的海量內容等你來看。太平洋下載中心提供今日頭條極速版下載賺錢哦。
  • 最搞笑的機器人喚醒問答:你叫什麼名字
    基於人工智慧的語音對話機器人,都會有一個喚醒語。只有喚醒了,才能開啟機器人的監聽模式,讓它們和人類進入對話場景。而現在的人工智慧機器人,基本都有一個名字;而每一個名字,基本就是這種機器人的喚醒語。所以,現在的機器人似乎總有這麼一個搞笑的對話場景:假如一種機器人叫HK,那麼在演示的時候就可能有這種搞笑而矛盾的聊天問答:人:HK你好機器人:你好你好。人:你叫什麼名字?