新聞寫作機器人的應用及前景展望——以今日頭條新聞機器人張小明...

2021-01-13 人民網

摘要:在裡約奧運會上,今日頭條的一個名叫「張小明」的新聞機器人讓讀者眼前一亮。2秒鐘寫稿,擬人化語言,智能配圖......近些年來,人工智慧在新聞領域的應用越來越頻繁,不少人驚呼連記者這個行業都要被機器化了麼?本文將對當前新聞寫作機器人的應用情況、應用優勢和不足進行說明和探討,並對其發展前景作出展望。

關鍵詞:新聞寫作機器人;xiaomingbot;數據處理;機器學習

一、當前新聞寫作機器人的發展概況

在前不久結束的裡約奧運會上,一個名為「張小明(xiaomingbot)」的新聞機器人小試鋒芒。在奧運會開始後的13天內,共撰寫了457篇關於羽毛球、桌球、網球的消息簡訊和賽事報導,每天30篇以上。不僅囊括了從小組賽到決賽的所有賽事,且其發稿速度之快,也讓人驚訝——幾乎與電視直播同時。

「張小明」的核心——「寫稿模塊」由今日頭條媒體實驗室同北京大學計算機所萬小軍團隊共同研製。其工作原理是結合最新的自然語言處理、機器學習和視覺圖像處理的技術之後,通過語法合成與排序學習生成新聞。 作為第二代新聞機器人,「張小明」不僅可以通過檢索圖片自己選擇圖片,還能模仿人類的語氣,使用諸如「笑到了最後」、「實力不俗」等詞語(圖1)。

圖1

新聞機器人,或者叫AI機器人。是人工智慧在新聞領域的最新應用。其實,在「張小明」出現以前,新聞機器人就已被世界上的主流媒體所關注並加以使用。例如,國外有美聯社的WordSmith、華盛頓郵報的Heliograf以及紐約時報的blossom等。國內則有新華社的快筆小新、騰訊的dreamwriter、第一財經的DT稿王等。(表1)這些寫稿機器人無一例外都運用到了大數據處理技術。首先通過數據採集,將其錄入資料庫中,在將這些數據按照語句出現頻率以及新聞要素關鍵詞進行分析加工。製作出一套符合該媒體發稿風格的模板,然後將新聞元素5W1H代入其中,一篇新聞消息就這樣產生了。

表1

而這次成功搶鏡的「張小明」是今日頭條實驗室在裡約奧運會開幕一周前研發的AI機器人。它通過對接奧組委的資料庫,可以在極短的時間內完成消息撰寫,賽事匯總等工作。張小明屬於第二代寫稿機器人,比起他的前輩們,寫稿速度更快——2秒內完成稿件並上傳至媒體發布;擬人化程度更高——根據比賽選手的排名,賽前預測與實際賽果的差異,比分懸殊程度,可以自動調整生成新聞的語氣;發布稿件類型增加——不僅可以發布賽事消息,還可以生成整個比賽的賽事簡報;圖片識別篩選——可以識別圖像,在文章中選取插入賽事圖片,圖文並茂更加生動形象。

二、機器人寫稿的優勢:

1、提升發稿速度,全天候新聞熱點監測,提高新聞的時效性

時間對於新聞的意義非同小可,尤其是在當前網絡新聞環境之下,可謂是分秒必爭。新聞機器人通過之前學習相似稿件的寫作模式,憑藉其快速的信息處理能力,可以在極短的時間內就寫出一篇符合該媒體寫作風格的作品。以「小明」為例,在奧運會期間其一篇稿件的完成時間約在2秒左右,也就是說比賽剛一結束,稿件就已經寫好發布了。這讓其在發稿速度上要快其他媒體一步。其次,發出的稿件可以第一時間發布到社交媒體上,讓其消息在眾多類似消息中脫穎而出,更容易受到用戶的關注。最後,記者在長時間的報導壓力下可能忙中出錯,而身為機器「小明」可以實現全天候24小時監測賽事熱點,既不漏題同時也保證了記者有充分的精力應對關鍵比賽的詳細深度報導。

2、新聞更加全面,網際網路端新聞報導的長尾效應突出

頭條實驗室負責人李磊博士介紹,「張小明最大的意義在於,面對奧運會這樣同時舉行上百場比賽的綜合賽事,記者很難關注到每一場比賽,而機器人可以任勞任怨的為每一場比賽報導,無論這場比賽多麼冷門和不重要。傳統新聞理論並不認為這些冷門比賽或者熱門比賽(比如桌球)的前幾輪小組賽有新聞價值,可是通過我們的平臺測試,我們發現對冷門場次的報導任然有可觀的閱讀量。」 這說明在網際網路平臺上新聞報導的長尾效應十分突出,即由於受眾基數巨大,即使小眾用戶其數量也十分可觀。同時基於網際網路平臺的新聞傳播對個性化新聞需求的滿足也有利於用戶黏性的增長。這也符合未來定製新聞,分眾化新聞的大趨勢。

3、使記者從快新聞中解脫出來,著力對深度新聞的打造

當前,新聞消息的生成和傳播速度越來越快,新聞的時效性也要求越來越高,但與之相對的一則新聞消息的影響力卻大不如前。一方面,新聞的半衰期越來越短,另一方面快餐式的新聞充斥網絡。媒體行業的激烈競爭使得記者疲於應付千篇一律的消息,即便如此,漏題現象也時有發生。在這些消息上使用機器人寫作,使得記者可以從疲於奔命式的搶新聞中解脫出來,對事件背後的新聞線索進行深入挖掘和批判性地思考。從長遠看來,深度報導對新聞界是有百利而無一害,甚至可以讓快新聞逐漸慢下來,也給予讀者思考與品讀的時間。

4、面對巨大數據量處理時減少出錯量

對於經濟、體育類的新聞,常常有許多數字、數據需要整理匯總。人類記者在處理這些數字、圖表時,常常因為數據量大而忙中出錯。但是,機器人憑藉其超強的運算能力,可以處理海量數據,且不容易出錯。

5、不帶有個人情感,文章更加客觀

機器人新聞不帶有任何人類情感,文章的生成完全依賴於數據。比如在賽事匯總上,不會因為喜愛某支球隊而厚此薄彼。而是嚴格按照數據,客觀地陳述事實。在某種程度上,機器人新聞更接近新聞上對客觀性的要求。

三、目前機器人寫稿存在的不足:

1、機器人對信息的深度理解不夠

新聞機器人所能做的只是在現有資料庫的支持下,對文章進行詞彙和語句的抓取,然後進行排列組合,就像在進行一個複雜的填字遊戲那樣。機器人對文章的深度理解能力還遠遠不能與人類相提並論。例如,在張小明於8月16號關於奧運會男乒半決賽的一篇報導中,它寫道:絕望之際,失敗女神朝其拋出了橄欖枝。(圖2)機器人記者顯然沒能領會橄欖枝在自然語言中的含義。由此看來雖然身為第二代新聞機器人,在語義理解上仍具有很大缺陷。但隨著機器學習能力的不斷提高,相信這種低級錯誤是完全可以避免的。

圖2

2、扁平化新聞千篇一律,缺乏亮點和重點

這次小明發布的新聞可謂面面俱到,對每一場比賽都進行了報導。然而,由於模塊式的報導,難以迴避的一個問題就是千篇一律,每篇報導的結構甚至是用詞用句都差不多,缺乏亮點和重點,難以給讀者留下印象。例如,我們選取小明在羽毛球男單、男雙、女單、女雙四場比賽(圖3),可以看出,小明使用了大量相同或相近的詞語,且句子的排列順序都近乎相同:第一句先將新聞要素——時間、人物、地點、事件進行了說明。之後是對賽況的說明——精彩紛呈,高潮迭起。然後說明比賽時間、比賽規則、比賽結果、比分結果等。可以看到模板化複製痕跡很突出,且面面俱到,連賽制、體育場館、排名都詳細說明。但很明顯缺乏亮點和重點。

圖3

3、對信息的提煉和概括能力不足

要想把一篇文章寫好,對信息的概括和提煉能力是一個記者必備的職業素質,長而空洞的文章是沒有人看的。但目前的寫作機器人顯然沒有提煉和概括的能力,提煉與概括的前提是理解,機器人對於人類語言的理解能力還十分弱,這就限制了機器人寫作的文章體裁和領域。

4、寫作領域較為單一,目前局限為財經和體育

機器人新聞當前的應用還停留在以使用數據為主的新聞領域。具體的說是在財經和體育方面。主要工作是年度財報新聞以及賽事新聞。而且大部分的新聞機器人都較為單一的從事某一領域的寫作。很少能「身兼數職」、「一機多能」。這一方面是由於其初始寫作模塊的設置,功能較為單一,未能考慮到深讀學習功能;另一方面,數據壁壘的導致「小明們」不能獲取學習更多的數據資料,導致其「知之甚少」。

結論:目前的機器人新聞並不能等於智能新聞

很多人憂慮,由於寫作高效客觀,表述全面,機器人會取代編輯記者。但從目前機器人新聞的涉及面和功能來看,還不足為慮。所謂的新聞機器人其實只是一個自動化寫作程序。稱之為機器人還言之過早。它不能對其進行提煉升華、也沒有感性的語言作支撐。可以說它只停留在了智的層面,而沒有上升到情的高度。這樣寫出來的文章千篇一律,讀者缺乏情感的共鳴。此外,一些人將現在的機器人新聞稱為智能新聞,AI新聞其實是不準確的,目前的機器人新聞只是簡單的套用模板,簡單地對新聞元素做「加法」,真正的智能新聞應該是可以通過文字和人類進行情感的交互的新聞。

四、未來機器人新聞的發展方向:

1、跨領域的多面手:

目前來看,新聞機器人的寫作能力還僅僅停留在某一領域。一方面,現有的機器人寫手不像人類一樣,可以眼觀六路耳聽八方,它的處理器能力還很單一。交叉數據的處理能力很弱。其次,資料庫的開源也是制約新聞機器人跨領域工作的一個障礙,機器人寫手只有接入到相應的資料庫中才能繼續進行分析數據,加工模板,再套用寫作。不同資料庫之間的開源以及數據的整合使得機器人的跨領域寫作有一定阻力。因此,像新華網的快筆小新,它其實是有3個分身,每個分身各處理一個領域的新聞消息。但是,機器人的發展不可能局限於某一領域。隨著其數據處理能力的增強,以及數據開源成為可能。跨領域的機器人新聞寫作將成為可能,這樣一來,不僅大大節約了成本,而且寫出的稿件將更加全面,不同資料庫的資料可以相互補充,取長補短。寫作的類型也將不僅僅局限於短消息。使得人物通訊、甚至時事評論成為可能。

2、人類記者、編輯的助手:

將來的新聞編輯部很可能出現二加一的局面,即機器人記者同人類記者撰稿,機器人編輯同編輯共同審核把關。機器人記者可以對大量文本、音視頻數據進行處理,形成報導提綱或數據圖表,結果一輪對數據的加工,使得記者省去了查閱資料,整理匯總的不便,對報導重心做到心中有數,下筆有神。同時,可以協助編輯校對文稿,並快速發布到各媒體終端。

3、平等的交流者:

目前為止,寫作機器人還停留在單向度的接受指令,進行運算的層面。也就是說機器人還只能停留在輔助記者工作的階段。但相信在不久的將來,隨著數據量的增多,機器的運算能力的增加,以及機器對於自然語言理解能力的增強,機器人可以平等地同人類進行交流,對人類的意見進行反饋建議。

4、多平臺終端、資料庫資源的連通者:

未來隨著各機構資料庫、不同平臺之間的不斷開源,新聞機器人可以實現「推」與「拉」的多平臺終端、資料庫資源連通。一方面可以將寫好的稿件快速同時上傳到多個媒體平臺,例如目前機器人小明可以將所寫今日頭條的稿件自動共享到微博平臺;另一方面,將不同資料庫連通起來,使得數據交叉整合,發揮更大的效能。

5、媒介融合的推動者:

新聞機器人小明在這次奧運新聞報導中加入了圖像識別,可以挑選出合適的比賽畫面作為文章配圖。在今後的發展中機器人甚至可以將視頻、音頻甚至虛擬實境技術整合起來。實現真正地媒介融合。新聞機器人和可能是今後媒介融合的一個具體產物,它出現在新聞現場,根據新聞對象需要,安裝相應的新聞模塊,裝配虛擬實境攝像頭,可以快速寫稿、現場直播、製作VR作品.......未來的新聞機器人發展的可能性是無限的。

參考文獻

1Towards Constructing Sports News from Live Text Commentary,Jianmin Zhang Jin-ge Yao Xiaojun Wan,Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics, pages 1361–1371,Berlin, Germany, August 7-12, 2016

2新華網:http://news.xinhuanet.com/fortune/2016-08/12/c_129224795.htm 2016年08月12日 10:57:47

(責編:溫靜、趙光霞)

相關焦點

  • 2020年了,歡迎來到「智媒時代」|機器人|人工智慧|新聞機器人|新浪...
    我們發現,疫情期間,疫情報導機器人、數據新聞機器人、直播拆條機器人、海報視頻機器人、字幕生成機器人成為新聞機構最常用的媒體機器人TOP 5。在人的力量之外,技術究竟對媒體行業意味著什麼?目前落地的應用有9個,分別是信息採集、內容生產、內容分發、媒資管理、內容風控、效果追蹤、媒體經營、輿情監測、版權保護。整體而言,智能生產、智能分發是當前智能媒體應用最多的場景,也是創新應用最為集中的方面,如新華社推出「快筆小新」、AI合成主播、「媒體大腦」、媒體機器人等系列智能生產創新應用,人民日報推出了「黨媒算法」,領先的商業智能媒體平臺中,今日頭條等App更是以算法推送見長。
  • 搞過新聞、寫過小說,現在你孩子做的作業可能都是機器人改了
    文字新聞、視頻廣告,甚至你讀的詩、聽的歌、看的畫,都有可能是機器人創作的。AI不僅可以自己創作,甚至還能對文字加以潤色、提升,人工智慧寫作的時代正在全面來臨。難怪有人笑言,未來記者和編輯將會被機器代替,大部分的媒體從業者將失業。不過這樣的話題顯然已經是老生常談。如果說,AI寫作剛落地時大家還充滿惶恐,那麼現如今技術已經不再被簡單地視為「門外的野蠻人」。
  • 76秒|全國工業機器人技術應用技能大賽決賽在濟南開幕 閃電新聞...
    齊魯網·閃電新聞10月18日訊 走進第三屆全國工業機器人技術應用技能大賽決賽開幕式的現場,閃電新聞記者被一家「飲品店」吸引了。可樂雪碧冰淇凌隨便挑!
  • 想了解柔性驅動機器人研究現狀與趨勢,就鎖定今晚8點合肥工業大學...
    ,在裝備製造、醫療康復、國防安全、運載與服務等領域具有廣泛的學術價值、工程需求與應用前景。報告介紹柔性驅動機器人發展戰略意義、研究現狀、趨勢與挑戰,關鍵科學問題,以及面向國家重大需求和世界科技前沿等展望的一些思考。為了更多了解相關研究,合肥工業大學機械工程學院院長訾斌教授於12月18日線上直播分享柔性驅動機器人研究現狀與趨勢。歡迎掃描圖中二維碼或點擊網址進入直播間聆聽!
  • 佛山今晚登上央視新聞聯播頭條!
    佛山今晚登上央視新聞聯播頭條!今晚佛山登上央視新聞聯播頭條!這家工業機器人研發生產企業攻克了我國工業機器人核心系統的難題,自主研發的機器人控制系統實現了規模化批量應用,已經量產的工業機器人核心零部件自主比例超過了80%。創新驅動正在促進佛山實體經濟形成新的發展格局,持續推進供給側結構性改革。2020年,佛山產業結構持續優化,第二產業佔全市經濟比重達到56%,先進位造業佔規模以上工業比重達到50%,製造業高質量發展優勢持續釋放。
  • 華東師大成立智能教育研究院,「快樂機器人」、「寫作輔導機器人...
    「快樂機器人」「寫作輔導機器人」將成現實現場,智能教育相關領域的著名專家學者、長三角十多所高校教育學院院長、人工智慧領域企業代表等,共同見證了華東師大上海智能教育研究院的成立。據悉,研究院成立後,將致力於人工智慧與教育交叉領域的高端人才培養,同時開展「一體兩翼」科學研究。
  • 機器人技術日漸成熟應用前景廣闊
    據楊軍介紹,機器人是工業自動化技術的高度集成,世界各國都認識到,機器人是推動未來各行各業發展的重要力量,各類機器人研發項目都在有序推進當中,而我國的機器人研發主要表現在系統集成創新方面。上海電氣中央研究院的多機器人系統技術是國家「863」計劃項目,此次在「滬上·生態家」展示的「家庭生活多機器人支援系統」正是其中的一個部分。
  • 「快樂機器人」「寫作輔導機器人」研發中
    手中的平板電腦給出的學習路徑卻各不相同有的側重錯題解析和變式練習有的是鞏固量率對應相關知識有的則是重新學習相關基礎知識……請看上海電視臺的報導▲ 看看新聞儘快從探索轉化為教育教學中的實際應用,推動中國和上海教育在更高層次上的變革,為更好實現優質教育資源共享,更好滿足人民群眾對優質教育資源的期待做出貢獻。
  • AI 機器人沒有未來了
    智能化的人形機器人前景如何?想像一下如果《星球大戰》中沒有機器人C-3PO,只有R2-D2,那會是怎樣的結果?最新的本田ASIMO機器人可以像人一樣活動事實上,機器人技術對本田來說只不過是一項副業,主要是為了將技術應用到其核心業務(汽車、摩託車和卡車)中。公司代表也經常表示,ASIMO沒有更多的商業計劃,所以他們從來都沒有報價,也沒有太多發展計劃。撤資和解散ASIMO業務,轉而將其技術應用到其他計劃,這些舉動的確令人感到沮喪,但也是意料之中。
  • 萬物|《機器人與人工智慧教程》:基礎教育如何教授人工智慧
    針對智能教育的發展前景、智能教育培養人才的展望等主題,與會專家學者分別作了主旨報告,深入探討了智能教育領域的人才培養、教學實踐、政策舉措等。主旨報告結束後,與會專家學者展開了專題討論,探討了智能教育的發展以及未來趨勢,人工智慧等新技術的發展,教育行業如何積極面對新的變化帶來的挑戰。「智能教育可能觸發第三次教育變革。」華東師範大學教授賀樑提出。
  • 【頭條】LG首個送餐機器人落地!旗下餐飲機器人大軍又添一員
    國內的送餐機器人分為送餐和收餐兩種,大部分送餐機器人設計為三層託盤,收餐機器人的託盤數量和容積都大於送餐機器人,以便於最高效率的完成收餐服務。與國內送餐服務機器人略有不同的是,LG的Cloi ServeBot直接將送餐和收餐功能合併在一起,採用了4層託盤設計,可以同時滿足大容量的收餐服務。使用機器人是為了提高效率,同時解決對人類員工來說有難度的問題。
  • 閃電新聞「上新」智慧機器人和AI主播
    「高科技,棒棒噠」「不明覺厲」……《數據新聞同題PK,設計師VS機器人,你更PICK誰?》,10月2日,閃電新聞客戶端推出的這篇稿件,引起業內外關注。截至10月2日晚10時,投票結果顯示,2368人選擇「機器人」,票數佔64%。
  • 機器人寫稿還有哪些難點?
    寫作機器人,我覺得比較難的問題,一是歸因,二是舉證,三是應景,最後是個性風格。
  • 曝光| 「今日頭條」、「一點資訊」、「新浪新聞」、「網易新聞...
    曝光 | 「今日頭條」、「一點資訊」、「新浪新聞」、「網易新聞」涉黃被罰 原來你們是這樣的客戶端…… 原標題:   央視網消息:昨日,全國「掃黃打非」辦公室就雲盤、微領域、新聞客戶端等重點領域集中整治查辦的案件中,選擇了8
  • 一文看懂水下機器人的發展及應用
    從「上天」到「下海」,水下機器人作為機器人新形態的出現也為人工智慧的發展拓寬了領域,而作為發展的新方向,其也應「大有可為」。 深海競爭領域中的「新藍海」 近年來,在無人機市場的帶動下,水下智慧機器人產品也開始嶄露頭角,並在資源調查取樣、打撈和軍事等方面獲得廣泛應用。
  • 據韓國KBS電視臺新聞報導,新冠肺炎使智慧機器人代替人工服務成為...
    導語:近日,韓國KBS電視臺早間新聞對一家韓國餐廳裡的特殊服務員進行了報導。 近日,韓國KBS電視臺早間新聞對一家韓國餐廳裡的特殊服務員進行了報導。這位送餐服務員的特殊之處在於它是一臺智能服務機器人。據報導稱,新冠肺炎的餘波讓韓國在眾多領域已經選擇投入人工智慧機器人進行無人化服務。
  • 醫療機器人行業的七大關鍵技術
    最近機器人的新聞鋪天蓋地的襲來,電影作品也是層出不窮,還記得大白嗎?那個暖男大白,同時可以測試你的身體健康狀況的大白。現在這件事不僅僅存在於電影裡面了,《2016-2020年中國醫療機器人300024產業深度調研及投資前景預測報告》中顯示,醫療機器人已經開始慢慢進入我們的生活了!帶你看看一臺價值一百八十萬美元的醫療機器人內部    那麼醫療機器人的最新強大的技術支持有哪些呢?
  • WRC 2019熱點直擊:優必選機器人憑什麼又上新聞聯播?
    昨晚優必選機器人又上新聞聯播啦原來是機器人家族攜手亮相2019世界機器人大會繼在CES 2019首次震撼亮相2019春晚展示中國AI力量Walker機器人首次登陸全球最高規格的機器人大會展示家庭服務的技能
  • 維基百科上最高產的作者,是一個機器人
    是的,機器人在維基百科上應用的歷史悠久廣泛得內部在 2006 年就已經設立了專門審核和管理機器人的 BAG。從流程來看,如果有維基作者想在社區應用機器人,他們必須先向 BAG 提交申請,闡述機器人的功能、程式語言以及它預計會涉及的頁面數等信息。隨後,BAG 的成員會綜合多方面預估其可能帶來的影響,並決定是否通過。
  • 「小新」和「小聞」,進博會上兩名機器人志願者成了新聞人物
    「小新」和「小聞」,進博會上兩名機器人志願者成了新聞人物 澎湃新聞記者 俞凱 2020-11-03 21:46 來源: