近幾年,中國、日本、英國、歐美等國先後將人工智慧(AI)確定為國家戰略,對AI的資金投入逐年攀升,以此提升國家競爭力。中國也早在3年前就加入了AI創始國行列。至今中國已成為全球範圍內AI研究領域最大的參與者。
作為消費者,我們的日常生活已經被AI包圍,每天都在接觸著AI。通過地圖軟體了解如何避開交通堵塞、找到去辦公室的最近路線;過濾掉垃圾郵件;在網站上像機器人一樣提問;得到音樂上的建議;得到工作上的建議;了解其他消費者都做了什麼,等等。這些交互信息幫助我們從與系統的互動中找到答案。與此同時,AI技術在出版業也有愈來愈廣泛的應用,為企業和用戶提供更多的應用場景。
英國出版商協會在去年11月~今年3月間對130多位會員進行電話訪談及線上問卷調查後,近日發布了名為《AI在出版業的作用》的分析報告。報告稱,AI目前被應用於學術、教育和大眾出版商的整個價值鏈,來幫助企業提高IP版權保護水平、內容可見性及市場預測和其他策略分析能力,幫助用戶進行常規搜索和分析性總結,由此生成新的市場洞察。AI技術還可以節省研究人員、作者、老師和消費者的精力,專注於做有附加值或創新的事情。
該報告顯示,英國大多數出版商從2017年開始對AI技術進行投資,在出版社內部成立小型AI研究團隊(其中有一半的出版社將AI業務團隊設在英國本土),或者與AI技術公司和大學研究人員共同合作進行AI的研發應用。大型出版商使用AI技術來獲取並開發新內容,有3/4的大型出版商已經或準備在2年內將AI技術用於營銷和銷售環節。
出版商認為,AI會對出版商的競爭環境帶來巨大影響,有2/3的出版商預計未來將與不同類型的出版機構展開競爭。大多數已經應用AI技術的出版商都意識到AI投資的益處。從不同領域看,學術出版商可以運用AI技術支持科研成果的分享、發現相關同行評議人並對研究成果進行核實,幫助研究人員進行論文查重、侵權篩查,並為高質量的科研提供高質量的可見數據。
學術出版商將是AI技術的最大受益者。教育出版商運用AI技術開發教育內容,可以為學生提供更好的學業分析及個性化學習解決方案,讓教師有更多時間用在學生身上。在大眾出版領域,AI技術可以生成消費者內容,可以幫助作家節省日常調研時間、增加作家創作產量,出版商很快將開始營銷AI生成的小說。但AI技術生成內容的版權如何歸屬和判定,需要對版權保護法相關細則作出明確的法律界定,為出版商購買作品版權創建穩固的投資環境。
AI在出版業主要應用機器學習(ML)、深度學習(DL)、自然語言處理(NLP)、語言識別及計算機視覺技術。AI技術可以幫助出版商對內容進行分類,如使用元數據標記,將圖文識別技術與ML和DL技術整合起來,並結合搜尋引擎來改善內容可見性;可以幫助出版商發現市場趨勢,改善企業經營效率、成本結構以及用戶體驗,並為平臺的推薦服務提供支持。所有大型出版社在接受調查時均表示,將在2年內使用AI技術對內容進行分類。
該報告指出,為增加出版商對AI的投資水平並給消費者帶來更多利益,必須克服許多投資障礙,如缺少AI技術人才,難以將AI解決方案用於原有基礎設施及整合不同部門。對小型出版社來說,困難在於中前期階段要為AI研究和實施支付大量的投資成本。
因此,報告建議英國政府及業界提高對AI投資關鍵問題的認識,完善相關政策,共同推動AI應用及其他解決方案的實施。提出的主要建議包括:進一步完善版權保護法,促進出版商與關注AI的中小企業和學者之間的合作,幫助中小出版社在金融和技術方面得到AI技術的支持。該報告建議政府應通過設立挑戰基金(Challenge Funds)的方式,支持並鼓勵學者和技術型中小企業共同參與到AI技術應用創新中來。
英國出版商協會主席兼泰勒與弗朗西斯CEO安妮·卡蘭南(Annie Callanan)認為:「數字解決方案在整個疫情期間讓我們受益良多,技術的發展使虛擬活動得以實現。技術讓身處各地的我們連在一起。我們運用技術產生了顯著結果,同時,我們也要問自己,技術能實現什麼?隨著出版商對技術應用的不斷創新,我們可以信任法律來解決問題嗎?」她強調指出,AI技術不是要替代人類,而是解放人類,讓人類更有創造性,能夠探索新的研究領域並改變教育的方式。
英國出版商協會AI辦公室數據負責人克萊爾·查普曼(Claire Chapman)表示,掌握AI技術是目前中小企業面臨的困境,英國政府已向16個中心投資1億英鎊用於技術培訓,另外投資5000萬英鎊吸引AI頂級技術人才。她透露,政府將開設商務投資主題的AI研究生課程,發布2500個AI和數據科學的學位轉換課程,將面向1000位課程學員頒發獎學金,來吸引更多人參與AI的學習。該協會智慧財產權辦公室負責人羅斯·林奇(Ros Lynch)表示,該部門將督促出版商積極運用AI技術,並提供對AI應用的分析。
我們選取了9月在京舉辦的第12屆中國圖書館館長與國際出版社高層對話論壇及英國出版商協會的《AI在出版業的作用》分析報告中的5個案例,來闡釋AI技術在出版業的廣泛應用。
1
AI技術實現智能推薦 釋放科研活力
愛思唯爾產品副總裁羅斯·惠裡爾(Rose L』Huillier)以ScienceDirect平臺(以下簡稱SD平臺)為例,介紹了該公司如何運用AI技術,幫助研究人員進行科研並促進科學發展。
她表示,在信息泛濫的時代,研究人員處理大量數據是極其困難的。他們期待有足夠的工具構建和解釋海量信息。同時,研究人員做學術研究時發現,研究變得越來越跨學科。很多未知的術語正在被使用,而研究人員通常需要更多的信息來源。此外,研究人員在搜索和閱讀文章的過程中浪費了大量時間。
愛思唯爾在一年多前,通過使用機器學習(ML)和自然語言處理(NLP)技術,並藉助關鍵詞共現來構建AI領域,探究在這個領域使用了哪些不同的技術。惠裡爾以兩個例子來說明SD平臺上如何運用AI來幫助研究人員開展科研工作。
一個案例是運用AI技術創建SD主題頁。她指出,主題頁就像一個科學的維基百科網站,用戶通過它可以找到關於特定主題的基本信息。研究人員可能會遇到一些具體問題,如瀏覽一項科學研究時,遇到了一個不理解或不熟悉的領域中的專業術語,想更多地了解它。這時,研究人員可以通過點擊由AI完成的連結進入主題頁。研究人員也可能希望搜索某一領域的更多信息,SD製作一個可以被搜尋引擎發現的主題頁,便於研究人員通過搜尋引擎找到這些專業術語的可靠來源。
通過建立主題頁可以使用戶快速了解某個概念的相關信息。在主題頁面上顯示主題名稱、從書中摘取的對該主題的簡要描述,以及從一些圖書或文章中選取的與主題相關的信息片段及其他主題頁面上的相關連結,來幫助讀者了解與該主題相關的基礎知識。這樣的主題頁面完全是藉助AI技術自動生成的。這些技術已經運用到所有主題領域,目前SD平臺上有30萬個主題頁,每月有近兩千萬次的訪問量。
在運用AI技術生成主題頁時,首先通過不同領域使用的15種分類法來確認哪些概念是希望建立的主題頁。然後利用數據挖掘技術來運行分類法,選出想要使用的章節和文章,並生成主題頁。之後再運用NLP技術選擇相關信息片段。
NLP技術可以幫助我們確定哪些文章內容與該主題最相關,以及應選取多大的信息片段。有了一些信息片段後,我們就要確定哪個信息片段要優先展示,使用相關性排名運算技術會有助於揭示相關性最高的信息片段。最後一步是在整個過程中加入一些人工幹預,以保證數據質量。
她指出,需要從學科專家那裡獲取反饋意見以確保質量。在這個過程中可能會有一些主題是關於其他學科的,對此要進行特別處理。除此之外,主題頁會進行自我糾錯。ML模型使得數據質量不斷提升並且持續了解用戶瀏覽的信息片段,積累數據分析的信息。
另一個案例是運用AI技術提供推薦服務。推薦服務可以預測用戶是否喜歡一篇文章,以及這篇文章是否與用戶相關。SD的推薦服務可以幫助讀者減少搜索文章的時間,提高閱讀文章的相關性,並且提供人工搜索難以找到的答案。在推薦服務的幫助下,愛思唯爾幫助研究人員找到了通過其他方式找不到的文章。
她介紹,SD平臺從3年前開始,基於在SD上閱讀的文章,為註冊用戶提供個人推薦服務,並一直在改進其背後的技術,如運用AI技術收集用戶反饋、用戶點擊次數等數據,以及基於最相關篩選技術,推薦看過這篇文章的其他用戶瀏覽過的相關性文章,這大大提升了推薦服務的文章質量。此外,運用ML排序算法來確定每個章節文章的相關性排名,並通過用戶點擊率來發送反饋信息至系統中,使系統可以判斷哪些是相關的,由此確定下一次推薦文章的呈現順序。
另外,用戶在SD平臺上的瀏覽歷史記錄以及Mendeley Library中存儲的信息,都可以作為個性化推薦的依據。用戶可以定義一組想設置推薦的文章,如選擇推薦與其中一篇或者多篇自定義文章關聯性最高的文章。此項推薦服務可以實現用戶負責推薦依據,可以選擇不同的輸入內容。
惠裡爾表示,今後這項推薦服務將不限於推薦SD平臺上的內容,還將擴展到Scopus平臺上所有索引的內容,這項推薦服務也被稱為「Scopus Discovery」,這樣就可以讓研究人員的工作變得更加輕鬆。
2
AI技術改進與拓展對研究人員的服務
施普林格·自然集團大中華區總裁安諾傑(Arnout Jacobs)介紹了該集團是如何運用AI技術改進和拓展服務研究人員的能力,推動科學發現的。他指出,運用AI技術改變科技出版主要體現在出版、傳播、基於出版內容上的服務和非出版服務四個層面。
第一,在出版業務中,AI可以幫助出版機構尋找圖書作者,幫助作者尋找合適的出版物,並實施更為精細的質量控制,如篩查內容,減少剽竊、數據操縱及圖片造假等,還可以協助同行評議人的工作並幫助編輯進行決策等。
第二,在內容傳播過程中,AI可以幫助出版機構生成數字連結,從而藉助社交媒體等平臺提升內容的可見性,通過ML算法等工具幫助研究人員發現所需要的研究內容,幫助資助機構追蹤了解已出版研究成果的應用及再使用等情況。
安諾傑以論文為例,介紹了AI如何提取科學文獻中的數據和信息,並存儲於不同的資料庫以提升論文的影響力。AI技術不僅應用於論文,還應用於圖書出版。去年9月,施普林格·自然集團聯手德國歌德大學共同推出雲計算軟體Beta Writer,在此基礎上,匯聚數據研發團隊、全球化學、材料科學等學科專家及法蘭克福大學的優勢,出版了第一本運用AI技術自動生成的圖書《鋰離子電池研究報告》,運用集群技術識別每個輸入項的特定領域和範圍,依據相關性通過優選確定呈現順序;然後運用自動匯總技術進行摘要提取;最後運用聚合和釋義技術改善內容可讀性。今年9月該集團又出版了3本自動翻譯的圖書,這些圖書由機器從德文譯成英文,同時經過人工檢查,以確保內容的可讀性,由此節省了翻譯成本。
但安諾傑也指出,機器能給人類以幫助,但無法生成全新的思想。人們想學習和尋找什麼內容,機器無法知道,但可以幫我們去實現。此外,AI工具還能自動搜索圖書內容被引用、下載、關注,以及被媒體提及的情況,幫助研究人員和機構追蹤了解科研成果受到的關注和產生的影響力。
第三,在基於出版內容的服務方面,AI能自動生成和運作內容摘要和索引資料庫,幫助建立新的增值內容集合資料庫,以延長內容的使用期。用戶還可以從出版內容之間的關聯中獲得新的思路,建立新的資料庫,發現新的內容。此外AI還用於自動進行客觀的科研評估。他以施普林格·自然集團免費提供的工具科研圖譜(SciGraph)為例,介紹了該關聯數據平臺是如何幫助用戶分享數據、了解研究趨勢並提升內容可見性的。
第四,AI還使科研服務擴展到論文提交之前等階段。在這一階段,AI工具能幫助研究人員撰寫或合著論文,開展研究、克服論文撰寫中的語言障礙等。此外還能通過ML算法分析試驗數據,通過軟體幫助研究人員規劃試驗,節省時間和資源,加快科學進程,還可以幫助瀏覽現有文獻,以明確研究重點和方向等。這些AI工具包括施普林格·自然集團的SN Experiments,以及姊妹公司Digital Science旗下的Figshare和Dimensions所開發的各種工具。
3
AI技術助力研究人員更快發現相關成果
愛思唯爾2013年收購社交平臺Mendeley後開發的Mendeley Suggest工具,以及泰勒與弗朗西斯和丹麥人工智慧新c創公司UNSILO的合作表明,AI技術在幫助研究人員發現相關成果方面具有很大的價值。
泰勒與弗朗西斯和UNSILO的合作旨在為泰勒與弗朗西斯的內容生成元數據,便於出版社創建一個推薦引擎,便於用戶發現該社的相關內容,也有助於該社內容被Google Scholar等搜尋引擎發現和廣泛使用。研究人員可以使用NLP技術閱讀學術內容,創建知識庫,更快發現最有價值的、可製成標籤的關鍵詞。還可以運用NLP技術的反饋迴路,對算法進行微調。
泰勒與弗朗西斯公司預測,高質量的數據便於研究人員更快發現相關內容,出版社也可以通過提高可見性增加銷量。
Mendeley Suggest工具使用ML技術向用戶提供內容推薦及科研合作的建議,Mendeley平臺上的協同過濾功能可以根據用戶過去的使用記錄預測用戶偏好。Mendeley平臺還可以幫助用戶開展跨學科合作,如幫助巴斯德研究所等機構發現新的研究成果,幫助國際糧食政策研究所跟蹤及傳播學者的文章。
4
麥格勞-希爾完善兩大AI平臺 提升教學服務水平
近年來,麥格勞-希爾集團在AI技術領域投入不菲,其開發的AI技術支持的ALEKS和SmartBook兩大平臺,展示了AI技術在為師生帶來更大收益方面起到的作用。
2013年收購ALEKS公司後,麥格勞-希爾集團與加州大學團隊共同創建了ALEKS平臺(Assessment and Learning Knowledge Spaces),該項目獲得了美國國家科學基金會的資助。平臺使用AI技術向數學、科學、商學院和高校學生提供個性化內容。該平臺運用AI技術收集學生的30個問題,以此了解學習者對知識的掌握程度,這可以幫助教師決定用哪個主題進行授課。
麥格勞-希爾集團的另一個AI平臺SmartBook是由丹麥的教育技術公司Area9開發的,2014年該公司被麥格勞-希爾收購。SmartBook是一個自適應閱讀工具,2019年進行了升級。該工具可以給學生提供有重點標註的教材內容,使用AI技術來了解學生掌握情況,並引導學生強化未完全掌握的知識內容。
麥格勞-希爾集團認為,學生從這些平臺可以增加參與度,改善學習效率,提高學習質量,從而提高學業成績。教師可以得到學生成績提高的分析報告,迅速了解學生對知識的掌握情況,發現學習出現問題的學生。這些平臺也成為企業招聘新人的工具,如布魯內爾大學在學校開放日推介各招聘企業使用SmartBook平臺了解學生學業情況和職業發展潛力。
5
AI軟體助力生成高人氣遊戲和故事
今年5月,埃隆·馬斯克的AI研究實驗室OpenAI發布了GPT-3軟體,用戶可以用該軟體進行個性化測試並生成故事,由人類來編輯和審核。類似的運用AI技術開發的軟體也越來越多,這也使大眾出版市場呈現出更豐富的面貌,運用AI開發遊戲和新故事成為值得關注的一個新現象。
美國楊百翰大學學生尼克·沃爾頓(Nick Walton)開發的無限文本冒險遊戲《AI地牢》(AI Dungeon),自今年1月上線以來下載量突破1850萬次,每月活躍玩家超過100萬。這款遊戲採用了AI技術,玩家剛一進入故事場景就要作出選擇,由此生成不同的情節,玩家可以與遊戲中的人物一起體驗重建世界的新方式。沃爾頓希望可以獲得更多出版商的授權,將他們出版的內容開發成這種交互式遊戲,讓玩家在他們喜歡的場景裡展開無限的冒險行動。
有不少作者加入到《AI地牢》遊戲的文本創作中,如有的作者用《AI地牢》的遊戲界面寫了一部冒險小說,還有的作者使用DL算法推進創作中的劇情發展。
記者/渠競帆