人文計算與數字人文:概念、問題、範式及關鍵環節

2020-12-27 中國社會科學網

  內容提要:在歸納總結人文計算的價值意義並簡單回顧人文計算產生發展過程的基礎上,對比了人文計算與數字人文兩個概念的異同,認為用人文計算表述更精準,數字人文一詞有一定的歧義。分析了當前人文計算研究存在的不足,提出了人文計算的五階段範式作為人文計算的規範化研究方法,並對其中的若干關鍵環節進行了深入探討。

  關 鍵 詞:人文計算;數字人文;概念辨析;研究範式;研究方法

  作者簡介:黃水清,南京農業大學信息科技學院,南京農業大學領域知識關聯研究中心教授,研究方向為信息智能處理,信息計量。 

  基金項目:本文系國家社科基金重大項目「基於《漢學引得叢刊》的典籍知識庫構建及人文計算研究」的成果之一,項目編號:15ZDB127。

  1 引言

  人文計算(Humanities computing),或稱數字人文(Digital Humanities),是信息技術與人文科學交叉、融合的研究領域。近年來,由於大數據、機器學習等技術的長足發展及多項人文計算典型實踐的成功,人文計算已成為學界、業界的熱點,儼然有顯學之勢。在2019年1月10日由中國人民大學書報資料中心、《學術月刊》雜誌社和《光明日報》理論部共同主辦的2018年度「中國十大學術熱點」發布會上,「大數據視域下的數字人文」被評為2018年度十大學術熱點之一。人文計算的產生與發展,既是數字時代信息技術向社會各行業各領域全面滲透在人文科學領域的具體體現,也是人文科學自身響應時代發展要求,對思維模式、研究範式、研究平臺等進行變革的有益嘗試。

  人文計算為數字時代的人文科學研究引入了新的思維模式。信息技術對其他領域的滲透,使得各領域的研究方法和手段產生了巨大變化。人文計算的數據思維與計算方法為人文科學研究引入了新的思維模式,拓展了傳統人文科學的研究樣式,開闊了傳統人文科學的研究視界與運用場景。採用人文計算的方法,往往可以發現傳統人文科學研究方法無法得到的新觀點、新成果。譬如,人文計算中常用的關聯語義分析,可能揭示出與人類專家通過閱讀得到的完全不同的文本語義。

  人文計算為人文科學研究引入了新的研究範式。傳統的人文科學研究,大多遵循「提出問題——分析問題——解決問題」模式,方法論上雖有效,但也存在種種缺陷。如,推理過程容易為人詬病,論據、論點乃至結論可驗證性差,甚至淪為只有觀點沒有證據的一家之言。不同學派、不同觀點之間的爭論,因為沒有共同的邏輯起點、沒有數據支撐,常常變成自說自話,形如雞同鴨講。人文計算將自然科學與技術的客觀、理性、精確、系統、可驗證、注重過程等特點引入人文科學的研究,要求人文科學研究過程可重複、數據可驗證、方法可復用、結論可推廣,形成區別於前人的新的研究範式。

  人文計算為人文科學搭建了更為廣闊的研究與教學平臺。傳統的人文科學研究,往往是單個或數個研究者純粹意義上的智力行為,研究對象、研究問題、研究素材、研究人員大多局限性很大,人才培養方面依然延續師傅帶徒弟的傳統作坊方式,視界受限、平臺受限。人文計算則不同,其自身就是學科交叉、融合的產物。人文計算以數據為研究的基本素材,研究過程至少涉及統計學、計算機科學、語言學、圖書情報學、人文科學等學科領域,有可能還需要其他學科領域的參與。人文計算是典型的跨學科團隊合作協同研究模式,多學科背景的研究人員、多學科的研究方法、多學科的觀察視角融合交匯,突破了傳統人文科學在科學研究、人才培養方面的組織模式,形成更廣闊的研究與教學平臺,有利於承擔更大型的研究課題,有利於形成規模化的人才培養模式,符合數字時代大科學的研究特點。

  人文計算的實踐公認以1949年羅伯特·布薩(Roberto Busa)神父為託馬斯·阿奎那(Thomas Aquinas)及相關作者的著作編制語詞索引為開端。而1964年IBM在約克城高地組織的研討會和隨後出版的文集《文字數據處理研討會會議記錄》(Literary Data Processing Conference Proceedings)(1965),以及1966年約瑟夫·雷賓(Joseph Raben)主編的《計算機與人文學科》雜誌(Computers and the Humanities)開始發行,則代表了作為學科領域的人文計算正式走向學術舞臺[1]。

  對比布薩神父的工作,一定意義上也可將20世紀30至50年代燕京大學圖書館洪業等人編纂的中國古代典籍周遍型語詞索引《漢學引得叢刊》作為國內人文計算實踐的先聲。《漢學引得叢刊》的缺憾是,正是在布薩神父的工作開始啟動時《漢學引得叢刊》的編纂工作卻停止了,沒有能隨著時代和技術的發展進入數位化存貯與檢索階段。不過,20世紀80年代國內多名學者以詞頻為基礎探討《紅樓夢》前80回與後40回的作者,可看作典型的人文計算實踐,當無疑義。國內人文計算的理論研究則滯後得多。第一篇提及「人文計算」一詞的論文發表於2004年,文中介紹了維多利亞大學人文計算與媒體中心開發的一種互動式英語教學軟體[2]。但直到2012年,特別是2015年以後,國內該領域的研究論文才進入高速增長階段。

  總體來說,雖然經過了幾十年的發展,無論是國內還是國外,人文計算還處於分散式實踐摸索階段。時至今日,與人文計算有關的許多認識還很模糊,甚至某些基本概念都還存在爭議。對人文計算相關理念、方法的模糊乃至錯誤認識,將影響人文計算的學科發展,並在具體的人文計算實踐過程中造成偏差。本文將圍繞人文計算的內涵外延、面臨困難、研究範式以及研究過程中的關鍵環節等問題,針對其中的含混與模糊之處,拋磚引玉,以一己之見引發更多的興趣與關注,求教於方家,以利於人文計算的開展與發展。

  2 人文計算/數字人文?

  人文計算或數字人文,這兩個詞在國內和國外的文獻中都有使用,且指代基本一致,同時也都沒有學界一致接受的定義。從字面上看,兩個詞的共同點是都突現了信息及計算技術與人文科學的結合,區別在於人文計算落腳點在計算,體現了面向數據、作為研究工具及研究手段的特點,而數字人文從字面上看範疇更大、含義更模糊、產生歧義的可能性也更多一些。

  人文計算或數字人文,從萌芽、提出到成型,再到高速發展,反映了人文科學在科學研究活動中引進並融合計算方法、數據思維,響應數字時代的變革拓展研究方法的願望。從這個意義上說,相較於數字人文一詞,人文計算的稱謂更準確、更貼切,因為在人文計算一詞中更能體現計算與人文科學研究的結合,更能體現計算與人文兩者並重,更能體現計算是手段、人文科學研究是目的。可以這麼認為,人文計算就是將信息及計算技術應用於人文科學領域開展交叉研究的一種新型人文科學研究方法,主要但不限於,通過數據可視化、智能檢索、關聯分析、文本挖掘、知識發現等技術和手段,達成人文科學的研究目標。

  正如前文所述,傳統的人文科學研究範式存在缺乏數據支撐、可驗證性差等缺點,人文計算恰恰可以彌補人文科學研究這方面的不足。但是,人文計算既不是要取代人文科學,也不是要改造人文科學,甚至不是改造傳統人文科學的研究方法,而僅僅是拓展人文科學的研究方法、研究範式,為人文科學研究提供傳統研究方法之外的另一種選擇。人文計算本質上是人文科學領域知識生產的新方式,或者通過對數據的計算和挖掘發現人文科學中傳統研究方法無法或難於得出的某些新觀點、新線索,或者為新觀點、新線索的發現提供數據、技術及工具支撐。需要特別強調的是,這些新觀點、新線索還應該遵循類似王國維先生的「二重證據法」的思路,經過傳統人文科學研究方法的論證或檢驗,使人文計算的發現與人文科學自身的邏輯相互印證,才能成為真正的人文科學領域的新知識。

  從構詞方面看,「人文計算」一詞強調的是「計算」,強調的是人文科學研究中的「計算」,在英語中是一個名詞化的動詞,突出了知識發現的行為與過程。而「數字人文」一詞突出的是「數字」,以名詞或形容詞的形式對「人文」起修飾作用,給人的直觀聯想就是數位化,整個「數字人文」一詞也是名詞性的,因此數字人文很容易被誤解為數位化的人文科學或人文科學的數位化。這顯然違背了數字人文一詞的原意,超出了人文計算或數字人文的範疇,與人文科學的發展現狀也不相符。數字時代雖然給人文科學帶來了某些新的特質,但人文科學的相關活動並無全面數位化的跡象,即使有,也不是人文計算或數字人文能夠承載的。人文計算或數字人文只是人文科學的一個分支或交叉領域而已,目的是拓展或豐富人文科學研究工作,國內外人文計算或數字人文的研究者顯然都無意於基於數位化的理念重構人文科學。

  另一方面,「數字人文」一詞還存在混淆數位化與數據化的隱患。數位化與數據化是完全不同的概念,對人文科學研究活動具有更大促進作用的是數據化而非數位化。數位化僅僅把模擬量轉換成以0、1表示的二進位比特位存貯在計算機中,這些比特位能傳遞的信息非常有限,計算機並不能直接分析這些比特位的含義。數位化僅僅解決了記錄與存貯問題,距離成為計算對象還很遙遠。譬如,將紙質文獻掃描成為圖片保存在計算機中,實現了文獻內容的數位化,但其意義僅相當於為紙質文獻創造了一個數位化的複本而已,計算機並不能基於這些數位化的圖片開展針對文獻內容的語詞抽取、句法分析等運算。數據化則不同,數據化是將事物量化並成為分析、計算對象的過程,數據化的存貯單位不是無意義的比特位,而是有具體含意的字節、字。同樣以紙質文獻為例,將文獻的文本內容(章、節、段、句、詞、字等)以字節流或資料庫等方式予以存貯、多角度揭示,便成了可以分析、計算的對象,斷句、實體識別、自動分詞、詞性標註、詞頻統計、語詞關聯分析等一系列的計算工作便可以相應地開展起來。

  還有一點必須特別指出,「數字人文」一詞在學術文獻中並非只有與人文計算意義相同或相近的這一個含義,事實上,「數字人文」最初是以與人文計算完全不相干的另一個含義出現在國內學術文獻中的。

  國內期刊文獻中,「數字人文」一詞最早見諸2003年的一篇會議綜述[3],文章介紹了2002年12月由《中國社會科學》雜誌社和上海華夏社會發展研究院共同主辦的「數位化與21世紀人文精神」學術研討會上專家學者的主要觀點,會議的主題是數位化境遇中的人文精神。文中寫道,中國人民大學哲學系「陳專良教授提出『數字人文』的概念,認為『數位化』是一種人性化、以人為本的科技形式與力量,是對人的功能的合成、主體的系統表達,把原本屬於人的功能變為『人化功能』,是對為人所知的、具有同步性、可經驗性、以人為主體的世界『再造』,它超越了傳統科技與人文斷裂的形式與內容,是新時代科技與人文的一次新綜合。」會上,多位學者還研討並共同提出了數字人文的建構範式。此後,在2003年至2010年之間,國內學者共發表了10多篇內容涉及數字人文這一哲學概念的研究論文。在這10多篇文獻中,「數字人文」一詞的含義沒有變化,而同一時期作為人文計算同義或近義詞的「數字人文」並未見諸國內文獻。因此,至少在2010年之前,「數字人文」在國內文獻中還是屬於哲學、倫理學範疇的概念,指的是數字時代的人文精神以及以數字方式表現的人文精神。例如,2005年,廖祥忠以《「超越邏輯」:數字人文的時代特徵》為題闡述了作者對數字時代人文精神建設的思考[4]。從2011年起,與人文計算含義相近的「數字人文」概念才出現在國內期刊文獻,並且在2012年以後逐漸佔據主流。但是,用於指代數字時代人文精神這一詞義的「數字人文」仍然見諸學術文獻,包括近一兩年的文獻[5-8]。同樣詞義的「數字人文」也出現在外文文獻中。例如,米拉德·杜埃希(Milad Doueihi)[9]提出法國著名人類學家克洛德·列維—史特勞斯的三種人文主義(古典人文主義、東方人文主義、民主人文主義)應擴充為四種,即增加數字人文主義。查爾斯·特拉維斯(Charles Travis)[10]則把包含數位化人文環境在內的人類生存狀態定義為「新人類條件」(The New Human Condition,簡稱NHC)。

  有學者認為,人文計算與數字人文的研究範疇存在差別,前者是「假設測試與材料證實」,後者則是「提出假設、觀察、發現、分析、測試,再次提出假設」[11]。這其實是把知識發現的假設與檢驗兩階段強行切割開了。在知識生產過程中,假設與檢驗是相輔相成的,沒有經過檢驗的發現不能成為新知識,沒有假設檢驗則無從談起。這方面最典型的例子就是芝加哥大學Swanson教授提出的非相關知識發現方法。Swanson將非相關文獻知識發現分為兩個階段:形成假設和檢驗假設,後人將前者稱為「開放式過程」、後者稱為「閉合式過程」[12]。美國韋恩州立大學的Cory教授曾於1997年進行了一項典型的人文計算研究,只是在當時沒有這樣的稱謂。Cory教授應用開放式非相關文獻知識發現方法成功地發現了詩人Robert Forst(1874-1963)與希臘哲學家Carneades(公元前214-公元前129年)之間的關聯[13],研究過程中既包含了假設形成也包含了假設檢驗。還有學者認為人文計算僅局限於文本,而數字人文的對象不受文本的約束[14]。上述兩種觀點在原文中都沒有說明依據,應該是文章作者的個人認識,與實際情況也不相符。人文計算的假設、檢驗與非相關文獻知識發現的開放式、閉合式發現過程一樣,不能將其切割成為兩個不同的對象領域,開放式知識發現過程和閉合式知識發現過程都是非相關文獻知識發現的組成部分。事實上,各種版本的人文計算的定義在表述方面雖然存在差異,但所有的定義中既沒有將研究範疇局限在檢驗的內容也沒有將計算對象限定於文本的內容。相反,數字人文的定義[15-16]卻都強調計算與人文科學的結合,與人文計算的定義高度趨同。

  不可否認,目前數字人文一詞在文獻中的使用頻次比人文計算更高,數字人文這一概念的出現也在人文計算之後,但不能據此就認為數字人文是人文計算的發展與進化。實際研究活動中,數字人文與人文計算在內涵方面並無區別。數字人文的概念得到普遍接受,更多的是因為其中的「數字」一詞更具傳播效應、更加貼近普通讀者。從便於學術傳播這個意義上說,在文獻中使用數字人文一詞有一定的合理性。

  如果數字人文是對人文計算的發展與進化,數字人文與人文計算理應有不同的標誌性成果與典型案例。好比模擬制式移動通信終端(手機)的典型代表是摩託羅拉磚塊樣的大哥大,進入數字制式的蜂窩通信時代,非智慧型手機的典型代表就是諾基亞、愛立信、索尼了,而智慧型手機則是蘋果、三星、華為。但是,所有被數字人文選作典型性成功案例的,無一例外都是人文計算領域的典型性成功案例,如阿奎那語詞索引、《聯邦黨人文集》作者識別。數字人文的研究論文,莫不把阿奎那語詞索引、《聯邦黨人文集》作者識別當做數字人文的典型案例介紹。這好比一方面宣稱手機進入智能機時代了,一方面卻把諾基亞1100當作智能機的最成功機型。出現這種現象,要麼智能機時代還沒有到來,要麼根本沒有智能機時代。

  在社會科學中與人文計算完全對應的概念是計算社會科學(Computational Social Science),指的是計算和信息技術與社會科學研究的交叉結合。有意思的是,文獻中並沒有發現「數字社會科學」之類的概念,而且計算社會科學的概念最早見於2009年發表在《科學》上的一篇文章[17],比數字人文一詞出現得還晚。這進一步佐證了數字人文與人文計算不存在發展與進化關係。

  總體來講,人文計算內涵更準確,數字人文使用頻次更高,實際應用中這兩個詞完全可以當作同義詞看待。在正確理解內涵外延的前提下,根據約定俗成的原則,為增強傳播效應,使用數字人文一詞未嘗不可,但使用者須明了數字人文一詞的實質意義,避免字面歧義給研究過程帶來偏差。為嚴格語義,本文依舊採用人文計算一詞。

  3 人文計算的困窘及規範化

  差不多從進入新世紀的第二個十年起,人文計算風光無限,最直接的表現就是近年來相關研究論文激增。但是在表面繁榮的背後,窘迫與尷尬也一直伴隨著人文計算。人文計算的研究現狀,可用「三多三少」來概括。

  首先,追熱點的論文多,有實質意義的成果少。人文計算與數字人文當下已經成為時髦用語,研究論文紛紛往這面大旗上靠,無論是否真的開展人文計算研究都想方設法在論文的題名或關鍵詞中加入「人文計算」或「數字人文」的概念,其中又以「數字人文」尤多。但這些研究論文真正開展了人文計算研究的少之又少,大部分是把傳統研究工作冠之以人文計算或數字人文的名稱。研究者的跟風追熱點、趕時髦心態當然是造成這種現象的原因,數字人文的含義模糊也為這種行為提供了極大的便利。只要對象是在人文領域,把傳統的數字資源建設、標引、分類與檢索拉上一面數字人文的大旗,真不能說完全不對。比如,只要加上「數字人文視域」「數字人文背景」這樣的修飾語,以往普通的人文學科領域的資源數位化工作就可以納入數字人文範疇,以「數字人文視域(背景)下×××資源的數位化」為題寫作成文。但是,這類論文對人文計算並無實質的學術意義上的貢獻,最大作用就是增加了人文計算領域的成果數量。

  其次,非人文學者關注多,人文學者關注少。人文計算是人文科學與信息和計算技術的交叉研究領域,應該受到包括人文科學、計算機、圖書情報等學科領域在內的多學科研究人員的關注,由於其最終成果服務於人文科學領域,理應受到人文學者的更多關注,但從研究論文的分布情況看,人文學者產出的人文計算研究成果並不多見。丁波濤以「數字人文」為關鍵詞從中國知網檢索獲得了195篇有效期刊論文,通過關鍵詞聚類分析發現,最關注數字人文的學科是圖書情報學,「『數字人文』一直是由圖書情報領域的專家所倡導並持續推動」,「近幾年來各人文學科以及計算機學科的專家學者也加入這一研究領域,但圖書情報領域仍是主力軍」[14]。同一文獻還以「digital humanities」為主題詞對Web of Science核心集進行了檢索,共得到有效文獻210篇,同樣進行關鍵詞聚類分析,數據表明,圖書情報學科也是國外數字人文研究的主力軍,國外數字人文研究的特點是歷史學領域應用成果較多一些,也更重視技術進步[14]。數字人文與人文計算是交叉學科領域,與圖書情報學關係密切,圖書館還收藏有豐富的以文本方式呈現的研究資源,圖書情報學關注該領域、學者研究該領域的問題無可厚非,但圖書情報學成為該領域的主要推動者、主要研究力量,對該領域的發展無論從哪個角度看都不是好事情。缺席了人文科學與人文學者、以圖書情報學為主力的人文計算或數字人文,已經不再是交叉研究領域,其成果也不再是交叉研究的成果,這樣的繁榮只會是曇花一現,對人文計算或數字人文以及圖書情報學本身的長遠發展並無益處。殷鑑不遠,圖書情報領域不乏類似先例。

  最後,泛泛議論多,成功案例少。人文計算是對傳統人文科學在研究方法上的拓展,是人文科學領域知識生產的新方式,其最大的作用在於通過對數據的分析、計算發現人文科學特定領域的新知識線索。人文計算的研究雖然需要各個方面、各個角度的研究,但對人文計算的學術認同最具提升作用的是成功的人文計算案例。即便是現在,推介人文計算的文章仍然會重點介紹布薩神父的工作以及《聯邦黨人文集》作者身份識別兩個典型案例,成功案例的典範作用由此可見一斑。自2012年起,人文計算和數字人文在國內的研究成果直線上升,經過六七年的發展,每年發表的論文數量已不是個小數字,僅2018年一年CNKI就收錄了140多篇關鍵詞為人文計算或數字人文的論文。但是,雖然部分論文涉及資料庫建設及較為空泛意義上的「大數據」[11],部分論文涉及特定算法的應用與改進,其他的論文大多數至今仍停留在介紹人文計算或數字人文的理念、國外的相關項目以及某方面(如學校教學或圖書館)開展的工作等,現有研究最缺乏的是與文學、歷史、藝術史等具體人文學科的密切結合,已發表的論文中很少有自主開發的典型性成功案例。而針對人文科學特定領域的新知識發現,特別是其中具有典型性的知識生產與知識發現過程,才是確立人文計算學術地位、增加人文計算影響力外溢效應的優秀成果,才是人文計算領域迫切需要的成果,也是當前最缺乏的成果。

  人文計算的「三多三少」現象,其原因主要有以下兩個方面。

  其一,作為交叉學科領域的人文計算還不夠成熟,上述問題許多是學科發展過程中的問題。若以布薩編制阿奎那語詞索引為開端,人文計算已經有了幾十年的歷史,但阿奎那語詞索引的早期工作以及《聯邦黨人文集》作者身份識別,其實是手工完成的。時間進入21世紀,由於數據的豐富及計算能力的提升,開展人文計算研究的技術條件才真正具備。特別是機器學習的長足進步,技術上對人文計算形成了完美支撐,再也不會出現手工完成《聯邦黨人文集》作者身份識別任務這樣的現象了。正是在這樣的背景下,數字人文的概念被提出。雖然人文計算和數字人文都把發展歷程追溯到阿奎那語詞索引的編制,但從嚴格意義上講只有最近十幾年才真正得到了發展。作為學科領域,十幾年的發展過程顯然不足以成熟與完善,問題較多也就不奇怪了。

  其二,現有研究沒有充分遵守知識發現的規範化方法。人文計算本質上是在數據的基礎上面向人文科學的知識生產、知識發現過程,應該遵守知識發現的規範化研究方法,即問題定義、數據集建構、技術實現(含算法設計)、問題求解、結果評價及呈現的五階段範式。人文計算的相關研究應該或者完成新知識發現的全過程,即完成上述全部五個階段,或者對新知識的發現起到輔助作用,即對上述五個階段中的一個或幾個開展階段性研究,以利於後來者完成新知識的發現,也可以針對某個階段的關鍵性問題展開深入研究。其中,階段性研究必須以有助於完成知識發現為目的,研究過程應置於人文計算背景下做全景式思考。譬如,即使是單獨研究數據集建構、算法設計,也應牢記本次研究針對的是什麼問題,需要什麼樣的數據支持,算法必須達到什麼樣的性能,結果能否符合領域要求,等等。如此,人文計算範疇下的數據集建構、算法改進就很容易與一般意義上的文本型資料庫建設、檢索系統設計區別開了。

  人文計算的問題定義階段,目的是選定適合開展人文計算研究的對象與問題,明確對象與問題的範圍和邊界、預期目標、研究假設,預判研究價值、人文學者的接受度、數據及技術條件是否具備、結果評價及呈現的方法與手段等。這個階段特別需要與領域專家保持密切合作。

  人文計算的數據集建構階段,目的是為求解的問題準備所需要的數據集合。首先根據問題定義收集相關數據,釐清數據的含義及相互間的關係,檢查數據合法性並清除錯誤數據,然後,對數據進行冗餘剔除、語義標註、表述方式轉換、訓練與測試集抽樣等加工過程。其中的數據加工過程可能需要循環多次,以適應算法要求,使數據集合與求解的問題達到最佳匹配。

  人文計算的技術實現階段,目的是依據問題定義和已有的數據集合選擇適當的算法,並以程序設計語言實現算法,開發設計出相應的人文計算工具軟體或完整的軟體系統,使算法在數據集合上得以成功運行。技術實現階段需要注意四方面的問題。首先,算法及其包含的統計模型有其適用對象和運行環境,選擇算法時須充分考慮這一點,避免誤用。誤用算法的後果好比經濟學的供給模型被錯誤地用於研究市場需求,研究結論勢必大相逕庭。其次,針對問題和數據集合的實際情況,所選定的標準算法可能還需要進行參數調整或算法改進。再次,要特別重視算法的運行效率,確保人文計算軟體與系統能夠高效運行。也許問題定義、數據集建構、算法選擇都是正確的,卻因為算法實現過程中忽視了運行效率,使得開發的人文計算工具軟體或軟體系統缺乏實用性,運行後解不出問題的答案。最後,應在易用性方面盡最大的努力,降低使用難度,便於向人文領域學者推廣。如果開發出的是完整的軟體系統,最終目標是使系統成為類似非相關文獻知識發現的Arrowsmith系統那樣,面向同類型的多個任務,開放給全球研究者。

  人文計算的問題求解階段,目的是基於數據導出所定義問題的研究結果,主要工作是運行人文計算工具軟體或系統,對數據集合中的數據進行運算,提取數據之間的關聯關係,形成新知識的初始模式,最終導出人文計算的結果。工具軟體或軟體系統的運行者,既可以出身於計算機、圖書情報等學科,也可以是人文科學的領域專家,無論是何種身份的研究者,研究者本人都需要具備對應人文科學領域的基本知識及敏銳的觀察力,必要的時候還須與其他身份背景的學者保持互動與合作。問題求解階段需要密切觀察運行過程中的各項輸入輸出參量,必要的時候可能還要進行人工篩選、施加控制。另外,大多數情況下,運算後得到的結果都是數據與數據之間的關係,並非新知識的完整表述,僅僅提示了新知識存在的可能數據線索,人文科學的領域知識將有助於識別和發現數據線索,提煉數據所揭示的規律,從數據結果導向問題結果。

  人文計算的結果評價及呈現階段,目的是從所研究的人文科學領域的角度測評、解釋、檢驗、論證問題求解階段得出的結果並予以呈現。即使問題求解階段導出了問題結果,其本質上還是假設,沒有得到驗證的假設依然是假設,結果評價及呈現階段就是驗證結果的新穎性和有效性,並以人文學者能接受的方式呈現出來。結果評價及呈現階段起主導作用的必須是對應的人文科學特定領域的專家,而不能是計算機、圖書情報及學科的專家,測評、解釋、檢驗、論證的方法也必須是對應的人文科學特定領域的方法,而不能是計算機、圖書情報等學科的方法。計算機、圖書情報等學科的專家務必認真聽取領域專家的意見,以領域專家的意見作為判斷標準。如果領域專家對問題求解的結果不能完全接受,則可能需要回到問題定義、數據集建構、技術實現、問題求解階段,從其中的某個階段開始,調整或修改研究思路,再根據新思路依次完成後續各階段的研究。為更好地展示人文計算的結果,呈現過程可借鑑並融合多種技術手段,包括可視化方法。呈現的方式須遵循對應領域的規律與特點,多層級、多維度地展示成果。

  需要再次強調的是,以上的五階段範式是人文計算的完整流程,具體到實際的人文計算研究,並非所有的具體人文計算研究工作都要一次性走完上述全部五階段。某項具體的人文計算研究,既可以是完成五階段全過程,也可以是在五階段的總體框架下針對其中的某階段、某幾個階段,甚至是針對某階段中的某個問題開展研究。比如,只研究數據集建構,只研究算法設計,或者,只研究數據採集方法,只研究算法評測指標,只研究結果的可視化展示,只研究結果數據的可信度,都是可以的。但是,針對某階段、某階段的某個問題的研究,不能脫離人文計算五階段的總體框架,不能脫離人文計算問題定義的總體目標,這樣的研究就很容易區別於一般意義上的軟體設計、資料庫建設、資源融合、用戶服務等研究工作,就不會有偏差。

  4 人文計算的關鍵環節

  在人文計算的五階段範式中,有幾個關鍵環節。一定意義上,它們是其他環節的前提和基礎,決定了研究工作的成敗與水準。關鍵環節還突出反映了人文計算的特性,體現了人文計算研究方法與傳統人文科學研究方法的不同。這些關鍵環節,有可能對應於一個完整的研究階段,也有可能是某研究階段的一個組成部分。下文將重點討論其中的研究問題選擇、數據集、算法設計三個關鍵環節及需要注意的問題。

  4.1 研究問題的選擇

  好的目標等於成功的一半。選擇什麼樣的問題作為人文計算的研究對象,決定了後續的研究是否有價值、是否可行,甚至包括研究結果是否正確。

  研究問題的選擇在問題定義階段完成。如前文所述,在問題定義階段,要選定人文計算研究的問題,明確其範圍和邊界,提出研究假設,設定預期目標,並預估未來的研究過程中可能遇到的困難及應對措施,包括研究結果能否被人文學者認可和接受。

  選擇人文計算的研究對象和研究課題,不能單純從人文計算的角度,而應該從人文科學的現實需求出發並結合人文計算的可行性。簡單地說,所研究的問題不能僅僅是人文計算的問題,而應該是人文科學與人文計算共同的問題。人文計算研究常犯的錯誤是在選擇研究對象與問題時僅考慮現有數據、現有技術能實現什麼、能得到什麼,換句話說,相當於人文計算研究者手上有什麼做什麼、什麼簡單做什麼、什麼方便做什麼、什麼熟悉做什麼。這樣的研究對人文科學研究往往沒有什麼貢獻,人文學者也不感興趣,淪為人文計算研究者的自娛自樂。前述「三多三少」現象中「非人文學者關注多,人文學者關注少」的部分原因即在此。

  人文計算的最終目的是解決人文科學領域的問題,更確切地說,是研究並解決在人文科學領域有現實需求與研究價值但在目前情況下採用傳統的研究方法暫時不能解決或較難解決的問題。選擇人文計算的研究對象和研究課題,應該從對人文科學領域具有現實需求和研究價值的角度,兼顧人文計算所需要的數據資源、計算能力,選擇研究目標明確、數據可獲取且質量有保證、有對應計算方法、結果明確且可以驗證的人文科學問題作為研究課題。

  選擇人文計算的研究課題,重點可以考慮以下幾個方面:

  如上文所述,首先要考慮在對應的人文科學領域是否具有研究意義和研究價值。人文計算最終要解決的是人文科學的問題,信息與計算機技術僅僅是研究手段,技術手段的作用在於促進研究問題的解決,而不是對人文學者炫耀技術。如果技術手段無助於解決人文科學的實際問題,那麼,再炫酷的技術也是徒有其表,不會得到人文學者的認可。如阿奎那語全集詞索引、《聯邦黨人文集》作者識別,都是人文科學領域此前沒有解決、有研究價值的實際問題。

  其次,開展人文計算研究前,對選定的課題及希望達成的結果要有一定的目標或假設。這裡的目標與假設,並非既定的結論,而是現有研究基礎上做出的推測、設想或暫定性的答案,正式研究過程中,便於根據目標與假設整理數據、設計算法。比如,《聯邦黨人文集》作者識別,事先假定不同作者作品在單詞使用習慣、詞與詞之間的依存關係方面存在差異,藉此可以識別文章作者身份,因此,針對性地分別收集文集中作者身份已確定、作者身份待確定的文章中的數據。在研究過程中,根據進展及出現的新情況,可以對目標與假設進行調整,同時相應地調整人文計算的數據集、算法等。

  第三,在現有人力、物力、技術條件下,對於所選定的人文計算研究課題能夠採集、獲得所需要的數據,並構建成為可供運算的數據集合。有時候,數據集還需要區分為訓練集和測試集,用於不同階段、不同目的運算。《聯邦黨人文集》作者識別即如此。倘若支持運算的數據不可獲得或代價無法承受,即使有再好的研究假設也無法開展人文計算。

  第四,要有針對研究課題的相應技術解決方案,包括統計模型的理論依據、算法可行性、技術實現環節等。仍然以《聯邦黨人文集》作者識別為例,其算法模型的理論依據是貝葉斯公式,數據採集與計算等各項工作全部由人工模擬計算機完成,技術上無障礙,缺陷是工作量巨大,花了十年的時光。

  第五,課題的預期結果在所屬人文科學領域可以驗證。知識發現的初步結果必須經過驗證才能成為新知識。發現的作用類似於望遠鏡,把對象作為整體觀察,分析、發現、識別出可能的規律,形成初步結果。驗證的作用類似於顯微鏡,對初步結果進行細緻入微的考察、檢驗、詰難,以符合該領域的理論體系、學科邏輯。人文計算既要起到望遠鏡的作用,也要起到顯微鏡的作用,既能通過問題求解發現新觀點、新知識的線索,又能用人文科學自身的方式驗證發現。可驗證的選題才是合適的人文計算課題。

  從以上五個角度分析《聯邦黨人文集》作者識別的選題,就很容易理解該項研究選題好在哪裡、為何成為人文計算的經典案例。《聯邦黨人文集》在美國歷史上地位崇高,已成為中小學生的必讀書,但其中12篇文章的執筆者在三位合作者逝世後的130多年來卻得不到確定。選這樣的人文科學問題開展人文計算研究,意義不言自明!此外,前人的研究已確認這12篇文章的作者或者為漢密爾頓或者為麥迪遜,而其他73篇文章的作者身份沒有疑義,以貝葉斯公式為理論依據統計單詞出現頻次、詞與詞之間的依存關係可實現作者身份甄別。研究假設、樣本數據、算法原理相應地都有了完善的方案,貌似無比困難的問題其實研究思路非常清晰。最大的難點是20世紀60年代沒有現今的技術實現手段,只能用人工方式完成單詞抽取、詞頻統計等一系列工作。這也是該項研究的最大障礙及拖延十年的原因。結果公布後,贏得了學者們的一致認可,百年來的未解之謎至此有了公認的結論!

  對比國內許多學者嘗試過的《紅樓夢》前80回與後40回作者識別,很容易得出結論:《紅樓夢》這個選題當前完全不適合用人文計算方法解決。《紅樓夢》是天下奇書,其作者身份在紅學界百年來一直爭論不休,部分學者甚至持《紅樓夢》原著沒有唯一作者的觀點,前80回與後40回作者分別為曹雪芹、高鶚所作只是眾多說法中的一種。何況,並沒有足夠數量的兩位作家的傳世文本作為訓練集。在這樣的前提下,只要紅學界關於《紅樓夢》作者的研究沒有重大進展,將人文計算用於《紅樓夢》作者識別,任何結果都不可能得到紅學界大多數專家的認可。

  人文計算不應該試圖回答人文科學領域專家都不認可的問題,而應幫助領域專家完成他有模糊想法但尚不明晰或缺乏實質證據的問題。知識發現的最高境界是通過技術手段得到領域專家人人心中所有、人人口中所無的結果!

  4.2 數據集

  數據是人文計算研究的基石,沒有數據,計算無從談起。數據的覆蓋面、質量和顆粒度等因素很大程度上決定了人文計算的可信度、成敗與深度。

  人文計算的數據採集、整理,首要原則是依據選定的研究問題精確定位數據要求,包括範圍、顆粒度、獲取方式、質量指標等。所研究的問題決定了對數據的要求。一方面,什麼樣的數據支持什麼樣的運算,沒有真實數據支持的運算只能算作仿真或模擬,覆蓋面不夠的數據代表性不足,質量不高的數據運算結果沒有可信度。另一方面,數據採集整理、數據集建構成本極高,依據所研究的問題界定數據範圍、數據質量有利於節約研究資源,中國的問題不需要採集全球的數據,問題若只需達到百分位精確度數據未必要達到千分位的精度。

  有一種情況需要特別說明一下。常常有單純研究數據集建構的研究課題,如阿奎那全集語詞索引就是典型例子。這類課題不以求解具體問題為目標,或者單純完成數據集建構,或者研究數據集建構中的某項技術問題。這類課題沒有選定的具體研究問題,如何定位數據要求呢?其實,這類課題還是有選定的研究問題的,只是所選定的研究問題不是某個具體的問題,而是一類問題。仍以阿奎那全集語詞索引為例,該課題面向所有關於阿奎那問題的研究,數據採集整理、數據集建構必須以能滿足此類研究任務的全部要求為目標。

  用於人文計算的數據有可能是結構化的,也有可能是非結構化的。人文計算的性質決定了後者的比例和可能性更高。當數據被採集、整理後,非結構化的數據還需要轉換成結構化數據。多數情況下,轉換後的結構化數據以資料庫的方式表示並存貯起來,成為可支持人文計算的數據集合。非結構化數據向結構化數據的轉換過程,其實是非結構化數據以結構化方式表示的過程,一般會有多種表示方式供選擇。各種轉換方案都會丟失一些信息,選擇方案時要結合算法實現的需要,在保留重要信息的前提下更利於算法的實現。

  某些時候,特別是當前機器學習技術得到廣泛應用的情況下,數據集還被區分為訓練集與測試集。前者用於問題求解前的機器學習或算法性能測試,後者用於實際問題求解。訓練集比測試集對數據質量有更高的要求,一般由人工構建。訓練集的數據質量越高,算法運行結果越好。常常有這樣的情形,更換算法對人文計算結果的影響,還不如提高訓練集的數據質量更直接、效果更好。

  當數據源為文本時,人文計算的數據集常被稱作語料。相應地,訓練集可稱作訓練語料,測試集可稱作測試語料。

  4.3 算法設計

  人文計算的算法模型,一般都是借用成熟的通用模型,不太可能完全從無到有自行設計算法。因此,算法設計其實是算法模型選擇、領域化改造、參數調整及算法實現的過程。如隱馬模型、最大熵模型、CRFs模型、神經網絡模型、非相關文獻知識發現的A-B-C模式等都可以經過領域化改造後應用於人文計算。

  技術服從於目標。人文計算算法設計一定要緊緊圍繞所研究的問題,根據問題定義階段對研究問題的界定選擇合適的算法模型,經過領域化改進後應用於特定問題的求解。

  與數據集建構類似,人文計算的研究論文常常能見到不針對具體研究問題單純研究算法的。這類研究的一般思路是:提出算法設計或領域化改造思路;實現算法;在特定的訓練集、測試集上運行算法;將運行結果與其他算法模型進行對比;總結算法的優缺點與適用場景。這類研究表面上沒有選定具體的研究問題,實際上針對的是類型化的問題,即算法模型可用於解決同類型的研究問題。這類研究同樣需要緊緊圍繞所研究的問題選擇、改進並實現算法。與一般研究不同的是,這類研究不是圍繞某個具體的研究問題,而是具有共性的某種類型的問題。

  另外,算法模型的選擇,一定要避免跟風,陷入「最好算法」的誤區。事實上,根本沒有「最好算法」。如果真有一種算法模型各方面都冠絕群雄,按技術發展的規律,其他的算法自然會逐步消亡,根本無須人文計算研究者對比選擇。人文計算研究者常犯的錯誤是把最新最流行的算法當作「最好算法」。在算法設計時不問青紅皂白選用最新最流行的算法模型,一方面可能增加技術實現的難度,另一方面還未必能帶來好的運算結果。比如,近年來深度學習技術取得了長足的進步,人文計算的研究論文幾乎言必稱深度學習,仿佛不採用深度學習算法研究水平就低人一等似的。深度學習即使是屠龍刀,也是有適用的前提條件及應用場景的。屠龍刀若用在廚房,效果未必比普通菜刀強。條件不具備,場景不符合,深度學習算法便不適用。

  還有一個問題,就是數據集的作用。前文也提到,某些時候,算法改進還不如更換數據集作用大、效果明顯。算法設計與數據集關係密切,數據對象不同,算法效果差異很大。

  雖然沒有「最好算法」,但在現有技術條件下,在特定數據集基礎上針對特定問題一定有「最適用算法」。一定意義上,最適用的算法便是最好的算法。針對特定問題,通過不斷研究、改進得到最適用的算法,是算法設計的研究任務。

  最後,人文計算的目的是求解人文科學特定領域的研究問題,只有研究結論在人文科學領域得到認可,才能證明人文計算的所有技術手段包括算法模型是正確的,而不是相反。技術手段高超並不能證明結論正確,但結論正確說明技術手段運用得當。算法設計要防止變成技術手段的炫技,人文計算研究要避免淪落為研究人員卡拉OK式的自娛自樂!

  5 結語

  為釐清學界對人文計算與數字人文的認識,避免偏差,本文分析比較了人文計算、數字人文兩個概念的內涵外延。作為概念,人文計算的表述更為準確,數字人文一詞則容易引起歧義。不過,當前數字人文一詞使用更廣、社會號召力也更強,按約定俗成的原則,在研究過程使用數字人文一詞未嘗不可,但須明辨其實質含義,防止概念歧義對研究過程造成偏差。

  人文計算和數字人文雖然經歷了幾十年的發展歷程,但只是在近十幾年隨著技術的進步才真正進入高速發展期。人文計算和數字人文順應了數字時代的到來,將信息與計算機技術引入傳統的人文科學領域,其發展趨勢已銳不可當,人文計算和數字人文一定會有輝煌的未來。

  人文計算和數字人文短暫的發展史,取得了成績,也積累了問題。這些問題和困難一方面是學科發展初期中的問題,另一方面是因為沒有嚴格遵守問題定義、數據集建構、技術實現、問題求解、結果評價及呈現的五階段研究範式而造成的。人文計算是面向人文科學的基於數據的知識生產、知識發現過程,五階段範式應該作為人文計算規範化的研究方法。具體的人文計算研究,既可以完成五階段的全過程,也可以在五階段的框架下針對某個階段、某個階段的某個具體問題開展研究。人文計算的某些關鍵環節決定了整個研究工作的成敗與水準,既是人文計算研究的難點,也體現了人文計算與人文科學傳統研究方法的不同,在研究過程中須重點關注,以利於提升研究質量。

  原文參考文獻:

  [1]霍基.人文計算的歷史[J].葛劍鋼,譯.文化研究,2013(4):173-193.

  [2]劉夢蓮.利用HOT POTATOES創建互動式英語習題[J].外語電化教學,2004(2):73-76.

  [3]李振,奚建武.信息化進程的前沿探索——「數位化與21世紀人文精神」研討會綜述[J].探索與爭鳴,2003(2):34-36.

  [4]廖祥忠.「超越邏輯」:數字人文的時代特徵[J].現代傳播,2005(6):23-25.

  [5]張璐璐.數位化時代中國人文精神的建構[J].學理論,2015(16):199-201.

  [6]石佳友.治理體系的完善與民法典的時代精神[J].法學研究,2016(1):3-21.

  [7]孫振海,沈麟.「數字人文觀」對翻譯教學的反撥效應[J].英語教師,2018,18(23):14-16.

  [8]劉亞斌.論界面閱讀的技術和身體政治[J].學習與探索,2018(8):169-174.

  [9]Doueihi M.About Digital Humanism[EB/OL].(2013-07-16)[2019-03-10].https://www.inaglobal.fr/en/ideas/article/about-digital-humanism.

  [10]Travis C.GeoHumanities,GIScience and Smart City Life world Approaches to Geography and the New Human Condition[J].Global and Planetary Change,2017(156):147-154.

  [11]戴安德,姜文濤.數字人文作為一種方法:西方研究現狀及展望[J].趙薇,譯.山東社會科學,2016(11):26-33.

  [12]黃水清,馬俊嶺.漢語社會科學文獻非相關文獻知識發現的實證研究——以農業經濟學文獻為例[J].中國圖書館學報,2009,35(4):31-38.

  [13]Cory K A.Discovering Hidden Analogies in an Online Humanities Database[J].Computers and the Humanities,1997(31):1-12.

  [14]丁波濤.計算社會科學相關概念的比較與辨析[J].情報資料工作,2018(6):60-67.

  [15]Berry D M,Fagerjord A.Digital Humanities:Knowledge and Critique in a Digital age[M].New Jersey:John Wiley & Sons,2017:18.

  [16]Wikipedia,The Free Encyclopedia.Digital Humanities[EB/OL].(2019-02-24)[2019-03-02].

  https://en.wikipedia.org/wiki/Digital_humanities.

 

  

  

相關焦點

  • 「技術、媒介與人文:跨學科研究範式多元轉型」學術研討會在京舉行
    2020年12月4—6日,首都師範大學文學院與首都師範大學跨文化跨媒介研究中心舉辦的「技術、媒介與人文:跨學科研究範式多元轉型」學術研討會在京召開。來自全國各地的70餘位專家學者圍繞技術、媒介與人文的關係問題,延伸到人工智慧的影響、大學教育形態、電影範式轉型、哲學範式轉型、現代性起點的反思、人類學範式轉型、文學範式轉型、網絡電影以及各種技術文化形態的新境地所帶來的對藝術認識的技術路徑的拓展,還有新的技術語境下中外文化間交流模式的更新等問題展開研討。
  • 數字人文時代英語專業的機遇與挑戰
    仲偉合首先根據大家對「新文科」這一概念的不同闡述指出,「新文科」是相當於傳統文科而言的,是在新時代背景下,引領新科技革命、新經濟發展、新文化建設、新教育要求的文科。英語類專業在過去二十年的發展中取得了比較大的成績,但也存在一些問題。因此,需要明確人才理念,更新英語專業教學方式,提升人才培養質量。
  • 數字人文在古代文學研究中的初步實踐及學術意義
    數字人文研究將改變古代文學資料查詢檢索方式,實現從電子文獻的分詞定位檢索到結構化資料庫的分類提取,從點狀檢索到網狀關聯,從逐條拷貝到分類打包;能把傳統的靜態文本變為可隨意組合的動態文本;能改變文學史的認知角度和方法,時間上細化文學史的時間粒度,空間上深化文學的空間層次。由數字人文激發的編年系地並重的理念,將改變作家年譜和文學編年史的書寫範式。
  • 大學在「數字人文」中的角色和作用:重思理論與方法
    這三個問題實際上也是大學在「數字人文」中所要遵循或必須重新思考的理論依據,在理論思考的基礎上,才談得上如何使用的方法。當然,在方法中有很多具體的技術性問題。恰恰是在「數字人文」這個問題上,是有了數位技術之後,即變化發生之後,才繼續來思考人文的問題,但與人文精神似乎已經相當地遙遠,或者已經非常地迫切,甚至 「數字人文」這個概念本身就是「人文」的悖論。
  • 大力推進新文科建設,上海師範大學數字人文研究中心成立
    會上,與會學者們圍繞著數字時代如何發揮人文學術優勢,回應時代、社會重大關切,使人文社科研究能夠結合數位技術、方法與人工智慧等前沿領域最新進展,實現科技與人文社會科學的深度融合和協同創新等問題展開了深入交流。學者們還結合各自的研究領域和數字人文研究經驗,就其研究理論與方法、歷史與現狀、發展方向及數字人文項目發展模式等議題進行了集中研討。
  • "人文清華"講壇 | 江小涓:數字經濟,解構與連結
    11月20日晚,著名經濟學家、清華大學公共管理學院院長江小涓教授在"人文清華"講壇表示,中國在世界十大數字經濟指數最高的國家中名列第九,貢獻了全球創新網絡專利的15%,我們的數字經濟消費並未見頂,憑藉先進數位技術、巨大人口數量、龐大製造基礎、企業活力等優勢,中國數字經濟將全面發力。
  • 算法正義:呼喚數字時代的人文精神
    EdgeRank的作用是為Facebook上的每一種互動排名,演算法很複雜,但基本概念相當簡單,依據三種因素來計算:第一種因素是親近度,你在某人的帳號上逗留時間越長,表示你和這人的親近度越大,Facebook越有可能對你發布這人的近況;第二種因素是資訊類型的比重,以「感情狀態」為例,加權的比重非常高,因為大家都想知道誰正在和誰交往;第三種因素是時間,近期張貼的事項比舊事重要。
  • 何謂人文?
    本專輯即為阮義忠先生為各位釋疑的窗口,有關人文獎抑或阮義忠先生的任何問題,皆可拋來(重複的除外),將請阮先生在此一一作答。第一屆人文獎的初審評選將於10月中旬舉行,我們會作相關信息發布。無論是拿出作品參賽、捐助或是向人文獎提問,願您內心支持的呼聲化為行動的力量,與我們一起,以自己的方式參與支持人文獎。
  • 透視數字人文的奧秘!P8星球線上駐留藝術家群展對外開放
    在創作和策展過程中,大家碰撞思想的火花,用藝術創作闡述觀點,進行了一次開放性展示和討論,探索當下高度數位化社會的人文現狀及文化研究。「數字人文是這裡最重要的主題,但藝術家們的作品風格都有著不同的元素,因此這次關於數字人文的討論也會更加多元,這將是一次更加理性,更加獨特的藝術討論。」喻瑩認為,「藝術不僅僅在於視覺、聽覺和感覺,更多的是在於我們思想層面的存在。
  • 《優酷人文奇妙夜》:用創新年輕玩法賦予人文新時代表達
    以「碰撞與衝擊」「奇妙與人文」為特點,優酷打通線上線下的交流渠道,用創新、年輕、現代的玩法滿足新時代年輕受眾對「人文」的嚮往和追求,打造出有情懷、有趣味、有厚度的人文內容立體傳播矩陣。在洞察平臺受眾女性化、年輕化的群體畫像和拓展趨勢的基礎上,優酷積極尋找傳統人文與年輕表達的嫁接點,用年輕人樂於接受的潮流新形式給文化注入新的DNA,讓文化不再高冷,易於接受。搭建場景、降低門檻、捲入用戶、沉浸體驗,在秦皇島阿那亞海邊舉辦的人文奇妙夜,不僅囊括了部落市集、日落舞臺演出、人文大咖幕天分享、海邊紀錄片放映、圓桌宴等環節,還能讓用戶享受到各種創意升級的「寵粉」福利。
  • 王寧:「全球人文」呼之欲出,中國學者如何用好機遇
    這就是人文學科與自然和社會科學的區別。 *人文學科在大學發展中面臨評價問題和值得冒的風險 關於人文學科在大學中的地位和作用,不少中外學者已作過論述,有人認為發展文科面臨這樣兩個問題: 第一,關於文科的評價問題,即人文學科的評價問題。
  • 金大陸作品 | 中國數位音樂谷:打造國際級數字人文地標
    數位音樂是指以數字格式存儲,以網際網路為平臺進行傳播的音樂。數位音樂對傳統音樂產業產生了巨大影響,並由此帶來生產、傳播和銷售模式的一系列變革。數位音樂時代,音樂不僅是一種聽歌行為,從生產到消費,音樂產業正延伸到演唱會、音樂節、音樂硬體、明星養成等諸多周邊,逐漸形成以IP為核心的內容產業生態。區塊鏈作為一種新型數位技術運用於音樂產業的各環節,給音樂產業的版稅分配機制和版權保護等問題的解決提供了可能性。
  • 教育部中外人文交流中心與海南大學共建會計中外人文交流研究院
    教育部中外人文交流中心與海南大學8日下午在海口籤署協議,合作共建「會計中外人文交流研究院」。當日,海南大學「高層次國際化人才培養創新實踐基地」揭牌。  據介紹,教育部中外人文交流中心和海南大學通過共建「會計中外人文交流研究院」,為會計行業和相關企業走出去提供政策諮詢、智力支持與資源服務,促進會計行業的中外人文交流,助力管理會計人才培養、企業參與「一帶一路」建設和會計人才人文交流能力提升。
  • 科學網—尋找類腦計算的設計「範式」
    缺失的理論基礎 在通用計算領域有兩個著名概念——「圖靈完備性」和「馮·諾依曼體系結構」。前者用來衡量計算系統是否能夠用來解決通用計算問題,後者則是通用計算機運作的體系結構,該結構具有存儲部件與計算部件分離、程序與數據統一存儲等特性。 「通俗地說,一臺機器是只能解決一個問題還是能解決通用計算問題?
  • 北大教授的疫情反思:科學預測與人文感知
    19世紀時,人們已知天王星的運動不符合按牛頓力學所計算的軌道,科學家猜測,可能有什麼東西幹擾了天王星的軌道,很可能存在未被發現的新行星。1846年8月31日,法國科學家勒威耶發表一篇報告《論使天王星運行失常的那顆行星,它的質量、軌道和現在所處位置的結論性意見》,來專門討論這一問題。報告題目是不是太長太囉嗦?
  • 彰顯數位化時代的鐵路人文
    筆者在新聞中看到一個詞引發深思——「數字賦能」。 從鐵路運輸來看,「數字賦能」賦的是順應社會發展趨勢的各項便民措施。鐵路部門能夠審時度勢從更快更穩更安全的「復興號」問世到刷臉自助進站再到無紙質車票的「電子客票」時代的到來,通過完善和改進工作模式、啟用更強算法研製符合當下市場的「數字需求」,讓旅客體驗出行更美好。
  • 地產人文的N個細節
    15 書房牆上藏摺疊床,「可甜可鹽」迅速變換場景招商前海領尚公寓的60平方米以及90平方米的戶型有個小細節很吸引人,不講書房概念,而是提出「多功能房」概念,在書房之內藏了一個摺疊床,看書累了可以直接將其從牆上拉下小憩片刻,想迅速進入工作辦公狀態,將其收起,拉出椅子又可以立刻辦公。這種「可鹽可甜」的生活方式太適合忙碌的都市人了。
  • 喜報|上財商學院兩位教師獲得教育部人文社科獎
    近日,教育部正式公布了第八屆高等學校科學研究優秀成果獎(人文社會科學)的評選結果。我校有22項成果獲獎,獲獎總數位列全國第十四位;其中商學院教授蔣傳海,商學院副教授(常任教職)居恆,分別獲得諮詢服務報告二等獎、著作論文二等獎,標誌著上海財經大學商學院在教育部人文社科獎項方面取得重大突破。
  • 2020年中小學生人文素養及影視戲劇教育研討會在京召開
    》等相關文件要求,深入研討新時代以影視戲劇教育資源為重要內容及有效手段提升中小學生人文素養的策略路徑,研討會議分為領導致辭、啟動聘任儀式、專家講座、課題項目介紹及圓桌論壇等環節。他相信也希望深入研究影視戲劇教育在提高青少年學生法治素養及人文素養中關鍵作用及有效策略路徑,成為教育部裝備中心加強文科類教育裝備工作的有益拓展,作為落實全國教育大會和黨的十九屆五中全會精神的又一有力舉措。曹志祥主任進行領導致辭總結髮言。他認為,人文素養是一個融合、整體的概念,是一種人的內在精神品格。
  • 阮義忠攝影人文獎 • 今起設立
    但他指出:「並非紀實才叫人文,任何攝影手法,只要表達出對生存環境的珍視、對人間事物的關懷,都富於人文精神。」       「不管以什麼名字命名獎項,都會有異議,所以平息異議的唯一辦法就是你的質量。叫什麼都不重要。」以紀實風格著稱的攝影家呂楠,亦是首次接受邀請而擔當此類活動的評審。「一座獎項的高度有賴獲獎者的作品深度、力度與專業素養,評審環節至為關鍵。」