傳播中的離身與具身：人工智慧新聞主播的認知交互

2020-07-17 國際新聞界雜誌

於春，華東師範大學傳播學院副教授，美國馬裡蘭大學訪問學者。

本文系上海市哲學社會科學規劃一般課題」具身認知視域中人工智慧新聞播報優化研究「成果。

一問題的提出

智能化是席捲全球的又一波科技浪潮。2018年11月，新華社發布世界首位以真人新聞男主播為原型的人工智慧「AI合成主播」，2019年3月，新華社人工智慧新聞女主播上線。這既是新聞播報領域的一個現象級革新，也是認知科學與人工智慧領域中離身認知（disembodied cognition）與具身認知（embodied cognition）的某種交互融合。本文試圖予以探索：人工智慧新聞主播在其演進中如何踐行離身認知、具身認知及其交互應用？目前存在哪些問題？可能的優化進路是什麼？從自適應、自組織、自湧現的媒介進化可能來看，人工智慧與人類智慧未來如何共處？

二離身認知的淵源、成就與反思

離身認知（disembodied cognition）是第一代認知科學的主導思潮，也是人工智慧的理論來源，著重強調認知在功能上是能夠脫離人的身體而獨立存在的。離身認知的思想淵源可以追溯至古已有之的身心二元論。事實上，身心二元論雖早有思想成就，但也存在著某種現實困境，那就是只要接受身心二元論，就不得不面臨類似的非此即彼的艱難選擇。準確來說，人工智慧離身的哲學假設、胡塞爾的現象學及馬文·明斯基（Marvin Minsky）的表徵主義框架理論等，均為蘇格拉底、柏拉圖（Plato）、笛卡爾以降的西方理性主義傳統思維的某種延續。

離身認知同時也意味著認知是可以計算的。以「圖靈機算法可計算」為基礎，「認知可計算主義」逐漸成為認知科學領域的研究綱領（劉曉力，2003）。由於大腦科學、複雜性科學和計算機技術的不斷發展，認知科學也經歷了不同工作範式的轉換和競爭：從最初的符號主義到聯結主義再到行為主義，從最初的問題求解程序發展為人工神經網絡及至人工生命的研究，從符號計算推進為神經計算乃至進化計算（閻平凡，張長水，2002：357）。事實上，這些範式的不斷轉換和相互競爭，某種程度上來看正是源於對「認知的本質是計算」這一強綱領的深刻挑戰。雖然「計算主義」獲得了顯著的成就，但是在認知科學和人工智慧領域的進一步突破長期以來困難重重。

關於離身認知和「計算主義」的反思主要集中於：

哲學上的反思。人類的大腦、心靈和當前的計算機性能有著「本質差別」，大腦的某些功能或許如同一臺計算機，但是心的本質不是可以計算窮盡的，這是更深層和更高級的智能活動。雖然電腦程式可以按照語法規則定義，但其本身不足以確保語義的微妙呈現和心的意向性。當然，對於「機器永遠不能超越人心」這一論點，庫爾特·哥德爾（Kurt Gödel）倒是不反對用其不完全性定理作為部分論據。然而哥德爾也曾指出，要推導出這一強硬結論還有待附加兩個哲學假定：人心（mind）沒有物質載體；人類理性提出的問題人類理性一定能夠解答（王浩，1997：472-474）。

複雜性科學與生物學的反思。大腦的每一部分都是特異化的，整體心智活動是在其交互作用中得以完成，這與當前計算機存在本質不同。「心腦活動的基礎符合非力相關性原理，呈現出一種依存性的、內在的、整體自湧現的形式，它並非一個完全一致的系統」（周昌樂，2000：256-264）。因而需要引入複雜性科學和生物學維度，而不是理性主義、物理主義和還原主義的極端化。另外，人的心智仍在不斷進化，現代科學對於大腦的功能、意識的深層、心的本質等目前僅有極為膚淺的認識。在這種不多的認識下，試圖用哥德爾定理來推斷計算機永遠不能或永遠能超越人類心智，為時尚早。

計算機技術的反思。有些專家認為，如果計算機集成電路中包含的基本元件及其連接規模，能夠大大超過大腦的神經元件和連接規模，計算機就有望如同大腦那樣自湧現出高級心智。但是密爾本（G. J. Milburn）也曾指出，無論量子計算機的規模和速度多快，也仍然是以「丘奇—圖靈」論題為理論基礎，仍然是一種基於量子圖靈機的計算機。因而，期望以量子計算機來模擬人類智能並且自湧現出高級心智，還是沒有脫離「認知可計算主義」研究綱領（劉曉力，2002）。即使電腦程式能夠產生自湧現的特性，以切廷（G. Chitin）的算法資訊理論來看，計算機的複雜性本身仍有相當大限度，希冀計算機的複雜性實現人類心智的複雜性尚有相當距離，而複雜性之複雜性本身又是另一大難題（劉曉力，2003）。

作為認知科學與人工智慧在新聞播報領域的實踐應用之一，人工智慧新聞主播本質上難以脫離也基本遵循著離身認知、「計算主義」這一認知進路。人工智慧新聞主播嘗試離開真人主播的身體，試圖通過不斷更迭的計算機技術及算法程序來構建形象、模擬行為、複製功能等。

三具身認知的興起、源流與主張

具身認知（embodied cognition）被視為「第二代認知科學」研究的新進路。「第二代認知科學」的標誌性倡導為：身體是心智的基礎，身體在人類認知及相關社會活動中具有首要作用。

梅洛-龐蒂在《知覺現象學》中則區分和界定「客觀身體」與「作為世界中介的身體」，成為具身認知最直接的思想來源之一（李其維，2008）。梅洛-龐蒂（1945/2001：538-540）指出：身體最為直接地「在世界中存在」，「身體本身在世界中，就像心臟在肌體中」。「不通過身體的經驗，就不可能理解物體的統一性」，「物體的綜合是通過身體本身的綜合實現的」，而對於外部事物的知覺「直接就是我的身體的某種知覺」。

德雷福斯（Hubert L. Dreyfus）（1972：177-178）認為：「當我們棲居於世界中時，與我們同在並且根植於它們指稱情境的有意義對象，不是儲存在我們的心中或腦中的世界模型；它們就是世界本身。」這種思想即是海德格爾的「在世界中存在」思想，「在世界中存在」也是最基本的智能活動，亦是啟發史丹福大學計算機科學系教授威諾格拉德等人工智慧專家的海德格爾式人工智慧（Heideggerian AI）。德雷福斯認為：認知主義最大的缺點之一就是離身認知（disembodied cognition）。相關哲學論據使德雷福斯（1972：xi-xii）看到：「數字計算機由於無身而導致的局限性，比由於無心而導致的局限性更大。」德雷福斯對優化人工智慧的第一個建議就是：要重視身體在智能行為中的作用。德雷福斯的人工智慧身體觀，源於梅洛-龐蒂在知覺現象學中的核心概念：身體。梅洛-龐蒂（2012：431）還將存在落實到了身體上，以克服海德格爾「在世界中存在」的形式化缺點：

如果主體在情境中，甚至就是情境的一種可能性，這是因為只有當主體實際上就是身體，並通過這個身體進入世界中時，才能實現其自我性。在我反思身體的本質時，如果我發現身體與世界的本質相關聯，這是因為我作為主體性的存在，就等同於我作為身體的存在以及世界的存在。

德雷福斯對海德格爾的存在主義和梅洛-龐蒂的身體現象學的強調，與認知科學中的具身認知範式關係緊密。人工智慧研究重鎮麻省理工學院的著名機器人學教授羅德尼·布魯克斯（Rodney Brooks）（1999：167）提出：

智能系統的具身（embodiment）是至關重要的，而這有兩個原因。首先，只有具身的智能體，才可成為能夠完全應付真實世界的智能體。其次，任何內在符號系統或其他系統，都只有通過物理根基（physical grounding），才能得到立足點並使系統內部運行的進程具有意義。

史丹福大學計算機科學系教授、微世界研究中著名的積木世界程序「SHRDLU」設計者特裡·威諾格拉德（Terry Winograd）（2006）認為，「關鍵點不在於模擬智能的內在運作，而在於人與變動環境的交互。」他在與德雷福斯的會談中以及相關閱讀後，了解到海德格爾哲學與計算機系統設計的關係意義，放棄了對於知識表徵語言的研究，而轉向人機互動領域，由此倡導存在主義的設計進路。瑞士蘇黎世大學人工智慧實驗室主任羅爾夫·普菲爾（Rolf Pfeifer）（1999：xvii）確認，由於海德格爾的存在主義、梅洛-龐蒂的身體現象學、德雷福斯的人工智慧身體觀及威諾格拉德等啟發，他放棄人工智慧的離身進路，而轉向具身進路。普菲爾採用「感覺-運動」迴路，去替換先前人工智慧的「感覺-模型-計劃-運動」迴路。「模型-計劃」環節的去除，意味著表徵模式的去除，智能體通過身體傳感設備直接運動並與環境互動。比如，讓機器人經由中央凹處理，而不是先前的外在世界表徵模式，來凝視物體，機器人「移動頭和眼，使物體出現在中央凹陷——視網膜的高解析度中心的過程」（普菲爾等，2007/2009：86）。這類具身設計一定程度上可以克服模式識別的難題，大大縮減表徵模式的龐大計算量。比如，機器人在完成抓取玻璃杯任務時，如果機械手是用堅硬又欠缺彈性的材料製成，那麼其控制程序就可能非常複雜，而如果採用近似於自然肌肉的人工肌肉時，問題得以大大簡化。許多原本由控制程序執行的計算任務，由材料代替了。

四人工智慧新聞主播的認知交互：

離身認知、具身認知及持續創新

人工智慧新聞主播誕生之前，曾經出現一波虛擬主持人熱潮，開始萌動人工智慧在新聞播報領域中的離身認知、具身認知及交互應用。網際網路發展初期，能夠播報新聞的虛擬主持人「安娜諾娃」於2000年4月由英國報業聯合會新媒體公司推出。其後在一些國家相繼出現了一系列虛擬主持人，如中國「Go girl」「言東方」「伊妹兒」和「江靈兒」，美國的「Vivian」，韓國的「Lily」等。虛擬主持人的離身認知探索主要體現在：試圖離開真人主持人身體去傳播信息；基本依靠真人線性配音，尚未實現如今可以離身重組的智能語音播報，也未實現如今可以離身重組的智能視音頻播報。

人工智慧新聞主播進一步探索人工智慧在新聞播報中的離身認知、具身認知及交互應用。2018年11月，新華社發布世界首位以真人男主播為原型的人工智慧「AI合成主播」並在隨後命名為「新小浩」。2019年3月，新華社採用真人女主播為原型的人工智慧新聞主播「新小萌」上線。而在此之前，2018年4月日本放送協會（NHK）推出人工智慧新聞主播「Yomiko」，2017年6月英國獨立電視（ITV）《早安英國》中推出機器人主播「Sophia」。英國廣播公司（BBC）廣播四臺《今日》節目甚至考慮用機器人主播模仿真人主播的風格並主持採訪環節，採訪內容是人工智慧的未來。人工智慧新聞主播紛至沓來，其離身認知主要體現在：嘗試離開真人主播身體的自然線性播報，通過提取真人原型在新聞播報中的語音、唇形、表情、動作和形象等，運用智能合成技術和深度學習等聯合建模資料庫，將所輸入的中英文文本非線性自動生成相應內容的智能音視頻，試圖展現與真人主播類似的新聞播報、信息傳播效果。

需要特別關注的是人工智慧新聞主播的具身認知及相關交互，可能成為人工智慧新聞主播持續創新的關鍵要素。如前所述，具身認知被視為「第二代認知科學」研究的新進路，認知科學的具身轉向及物質基礎同時也呼應著整個社會科學中的物質性轉向（Apperley & Jayemane，2012）。具身性、情境認知、認知發展和動力系統成為「第二代認知科學」的四個典型主張，由此奠定了「第二代認知科學」的基礎共識（李恆威，黃華新，2006）。四者當中，具身性（embodiment）被看作「第二代認知科學」最重要的核心概念，情境認知、認知發展和動力系統也都與之密切相關。

其一，人工智慧新聞主播的具身性（embodiment）。「回到生物學中去找約束」（李恆威，黃華新，2006），意指大腦活動根本上不同於計算機活動，人的心智來源於溫軟的肉身而非冷硬的機器，天然自會受到身體、生理、大腦、神經等約束。綜合考量傳播效果比如情感上的親和力、可信度、人格化和權威性，採用真人主播身體屏幕形象的智能播報，或許優於虛擬主持人時期的動畫形象，以及當前智能主播時代的動畫形象或者機器人身體屏幕形象——英國獨立電視（ITV）人工智慧新聞主播「Sophia」，其機器人身體及屏幕形象曾被觀眾認為有「恐怖」感，其後也折射人工智慧與人類智慧未來如何共處。另外，中國、日本和英國的人工智慧新聞主播都有各自命名，由此帶來的人格化、身份認知或許能稍許彌合人工智慧的受眾認知分歧、社會認知差異。需要注意的是，是否採用真人形象其實無關乎具身認知，比如平衡車只是行駛設備並無人體形象，但是它通過感應人體重心移動來驅動、變速和轉向，還能通過限速來培養初學者，即為具身認知、具身性和人機互動的某種應用。具身認知與具身性的蘊含和應用廣闊，人工智慧新聞播報的具身性及其應用優化亦有更多期待、更多想像力。另外，人工智慧新聞主播的具身性還體現在圍繞身體交互展開的情境認知、認知發展與動力系統等。

其二，人工智慧新聞主播的情境認知（situated cognition）。具身心智實現於情境的約束中，認知必須互動呼應於情境的狀況和變化，而不是對於情境的單向投射（李恆威，黃華新，2006）。例如新華社人工智慧「AI合成主播」，文本「一度創作」和新聞播報「二度創作」有很大不同，文本「一度創作」中沒有直說、不便直說的言外之義、新聞蘊涵，有經驗、有思想的真人主播在新聞播報的「二度創作」中可以採用停連、重音、語氣、節奏、情景再現、內在語和對象感等方法呈現出來。不同真人主播對新聞蘊涵的理解判斷不同，播報中的「二度創作」也不同。微妙之處正是新聞播報的準確性、個性化、創造性之處，也是不同真人主播在業務水平上的重要區分標準之一。同一文本不同真人主播的新聞播報藝術性尚且如此，不同的欄目、平臺、地域、受眾、時機呢？因此，儘管新華社人工智慧「AI合成主播」誕生即突破，邁出了關鍵一步，但是在不同情境中的認知互動有待加強。情境認知在很大程度上決定著新聞播報更高級的藝術性、創造性。

其三，人工智慧新聞主播的認知發展（cognitive development）：一個直觀的事實是，認知不可能完全由遺傳來決定，人類的認知能力是在複雜情境中起源和發展的。如果說具身人工智慧的目標不包括模擬和解密人類智慧，那麼目前它是相當成功的；如果考慮到它不僅試圖模擬人類的部分智慧，還希望發現人類智慧或生命的真正奧秘，那麼現有的具身人工智慧仍然相當初級（徐獻軍，2017）。比如，上文討論到當前人工智慧新聞主播雖有文本也難以進行播音「二度創作」。

其四，人工智慧新聞主播的動力系統（dynamic system）。認知是一個系統的動力湧現，同時涉及大腦、身體和世界之間相互複雜作用，而不僅僅是大腦中的一個孤立事件。具身心智的認知活動同時和情境相耦合，動力系統即是探索此類耦合情況下認知發展進化的動力機制。比如，目前具身人工智慧體通過「感覺-運動」的反饋循環來獲取的意義，仍是外賦的，而非內生的（徐獻軍，2017）。約拿斯在其控制論批判中指出：反饋循環不是有機體有目的行為的充分條件。自動搜索目標的魚雷和覓食的兔子二者之間區別在於魚雷的反饋循環運行不運行皆可，而兔子的反饋循環必須始終運行，因為這就是它的存在方式。換言之，魚雷反饋循環的開閉運行取決於外界使用者，而兔子則取決於自身（生存壓力下必須覓食）；兔子覓食行為的意義是自生的，而魚雷搜索目標的行為意義是外賦的（Froesea & Ziemkeb，2009：473）。當前具身機器人仍然不能在世界中獲得自生的意義。人工智慧新聞主播的自發性、主體性與能動性也有限，目前還無法實現真正自主的採寫、編評、播報，而是由其後的人類團隊主導完成。無論是智能語音合成技術，還是智能視音頻合成技術，都遠遠未能達到自組織、自適應、自湧現的高級心智，與人類智慧程度的自主採寫、編評、播報相去甚遠。或許，隨著認知科學與人工智慧的進一步發展，包括離身認知、具身認知及其交互應用的進一步突破，人工智慧新聞主播的自發性、主體性與能動性會而逐漸產生？人工智慧新聞主播的自發性、主體性與能動性，這既是科學問題，甚至是帶有一定科學幻想色彩的問題，同時也是法律規制、倫理哲學問題。

五人工智慧新聞主播的優化可能：

離身認知、具身認知與高階交互

人工智慧新聞主播的相關問題難以窮盡，正如當前的認知科學與人工智慧、離身認知與具身認知、「計算主義」與「新計算主義」甚而整個科學也難以窮盡奇妙精巧、廣闊深邃的人類世界本身。然而，問題求解、好奇心亦是人類不斷認知自身、不斷向前發展的原動力。

離身認知需要不斷向前，人工生命和進化計算存在可能。早期的人工智慧研究主要集中於邏輯推理的方法和程序規則的系統，在此之後更多認知科學家不斷走向不限於邏輯推理的方法和程序規則的系統，轉而進入以非線性科學、細胞自動機、形態形成和遺傳等理論為基石的人工生命研究，經由計算機來生成自然生命系統行為的仿真系統，通過信息數學模型來模擬進化的遺傳算法，力圖了解真實世界中的生命和生命過程（閻平凡，張長水，2002：357）。人工生命的倡導者主張，生命是系統裡各個不同組成部分及相應功能的有機化，在物理機器上能夠用不同方式創造這些功能的各種特性，進化本身可以視為一種探索試驗的複雜過程，最重要的是生物本身由其自組織性、自適應性造就，並不在於是否由有機分子組成（波素馬特爾，1998/1999：200）。由此，人工生命倡導者希冀就不是要再造一個大腦，而是藉助遺傳算法不斷進化出一個大腦。目前以人工生命為代表的行為主義被認為是極有前途的研究範式，重點強調複雜性科學和「人工有機體」的自組織、自演化、自湧現特徵。雖然「生命的本質就是計算」未必都能認同，但是人工生命及其進化計算成果的確是不斷給認知科學變遷帶來新啟示。

具身認知也需要不斷向前，不時回顧原初也是一種思路。布魯克斯在所著《沒有表徵的智能》中提出，人工智慧在現有計算機理論基礎上，尚未充分反映生物組織的智能，人類和其他動物是通過不斷學習來調整行為以便更好地適應環境從而認知的（Brooks，1991）。由此，我們似乎可以循著進化的階梯由低而高地尋找智能的源頭。布魯克斯（1991）認為：「當我們研究了非常簡單的低等智能時，發現關於世界的清晰的符號表徵和模型事實上對了解認知起到阻礙的作用，這表明最好以世界本身作為模型。」布魯克斯還試圖用人工造物系統來模擬場景、環境、情境。需要注意的是，不時回顧原初並不等於回到純粹的還原主義、物理主義和理性主義，而是有必要融合複雜性科學和生物學眼光。與此同時，仍然需要回答前述哥德爾的兩個哲學問題：人心（mind）到底有沒有物質載體？人類理性提出的問題人類理性是否一定能夠解答？計算機的複雜性本身仍有相當大限度，希冀計算機的複雜性實現人類心智的複雜性尚有相當距離，而人類智能的自湧現、自適應、自演化或許是複雜性之複雜性其後突現的簡單性。

離身認知與具身認知需要不斷走向更高階交互，以解決更高級的人工智慧認知問題。在持續進行的適應性生存演化中，人類認知的不同方面與不同水平彼此協調、相互促進從而共同形成一個「統一的姿勢」，而不是相互獨立、彼此排斥和截然分開的。既然人的「統一的姿勢」是由不同方面與不同水平的認知共同形成，在人工智慧認知上也不必在兩代認知科學之間做出非此即彼（either-or）的兩難取捨，而可以採取亦此亦彼（both-and）的交互融合（Clancey，1997：225-242）。若非第一代認知科學家嚴格秉持計算思想，也不會有計算機、網際網路、人工智慧等如此巨大的當代成就。恰如克蘭西的看法：「最重要的是，我不認為描述的模型是錯誤的而情境認知是正確的。相反，我的宗旨是揭示不同的觀點如何可能調和。我發現這樣的觀點常常是有益的......」（Clancey，1997：3）更進一步，亦此亦彼（both-and），而不是非此即彼（either-or），適用於離身認知與具身認知的和諧共處，也有益於未來社會人工智慧與人類智能的協調共存。「日益崛起的技術力量和日益提升的人類智慧之間進行的不是一場競賽，而是一個攜手並進相互擴容的過程。」（殷樂，2016：24）

本文系簡寫版，參考文獻從略，原文刊載於《國際新聞界》2020年第5期。

封面圖片來自網絡

本期執編 / 彤昕

訂閱信息

全國各地郵局均可訂閱《國際新聞界》，國內郵發代號：82-849，歡迎您訂閱！

您還可訪問《國際新聞界》官方網站 http://cjjc.ruc.edu.cn/ ，免費獲取往期pdf版本。

傳播中的離身與具身：人工智慧新聞主播的認知交互

相關焦點

益普索聯合北師大新聞傳播學院成立傳播與認知效能評估研究中心

院士說丨戴瓊海院士:人工智慧——算法·算力·交互

人工智慧、機器學習及認知計算初學者指南

思必馳龍夢竹:人工智慧從感知進入認知階段

受腦認知和神經科學啟發的人工智慧

情緒傳播:概念、原理及在新聞傳播學研究中的地位思考

多才多藝的「虛擬主播」，你了解多少？丨智言智語

《新聞聯播》主播又上新了,她叫寶曉峰

人工智慧中的A I是什麼意思

人工智慧經歷兩次波谷之後將像水和電一樣無所不在

...主播亮相央視最美大學生、最美高校輔導員盛典,分身技術魅力無限

新聞傳播中的人文精神與科學精神

搜狗AI合成主播亮相央視最美大學生、最美高校輔導員盛典,分身技術...

遊戲、人工智慧與虛擬世界:一個創業團隊的產品和系統性思考

信息維度與互動設計原理

人機互動中的一個重要問題:認知負荷測量

浙江大學發布「意識、腦與人工智慧」十大科學問題

新聞的「話語圖示」——論對外新聞傳播中的跨語言書寫

傳播中的離身與具身：人工智慧新聞主播的認知交互

相關焦點

益普索聯合北師大新聞傳播學院成立傳播與認知效能評估研究中心

院士說丨戴瓊海院士:人工智慧——算法·算力·交互

人工智慧、機器學習及認知計算初學者指南

思必馳龍夢竹:人工智慧從感知進入認知階段

受腦認知和神經科學啟發的人工智慧

情緒傳播:概念、原理及在新聞傳播學研究中的地位思考

多才多藝的「虛擬主播」，你了解多少？丨智言智語

《新聞聯播》主播又上新了,她叫寶曉峰

人工智慧中的A I是什麼意思

人工智慧經歷兩次波谷之後將像水和電一樣無所不在

...主播亮相央視最美大學生、最美高校輔導員盛典,分身技術魅力無限

新聞傳播中的人文精神與科學精神

搜狗AI合成主播亮相央視最美大學生、最美高校輔導員盛典,分身技術...

遊戲、人工智慧與虛擬世界:一個創業團隊的產品和系統性思考

信息維度與互動設計原理

人機互動中的一個重要問題:認知負荷測量

​浙江大學發布「意識、腦與人工智慧」十大科學問題

新聞的「話語圖示」——論對外新聞傳播中的跨語言書寫

浙江大學發布「意識、腦與人工智慧」十大科學問題