「數字報刊與跨媒體出版系統」專題之一
數字報刊與跨媒體出版
徐 萍 樓險峰
最近十年,以報業為基礎的綜合性新聞網站得到高度重視,取得轟轟烈烈的發展,成為媒體研究者的焦點。但是,以報紙翻版為使命的各類「電子報」、「電子版」、「網絡版」、「寬帶報紙」等媒體樣式,整體上也沒有大的變化。即便如此, 「電子報」同樣保持很高的訪問量。
2005年,浙江日報報業集團與北大方正電子公司共同完成了的一項重要的科技成果,它把傳統報紙的數位化翻版技術和觀念,提高到「報業產品數位化」的新高度,成為報社跨媒體發展的新動力。
數字報刊系統的核心是「跨媒體出版暨數字報刊自動生成系統」,在全新的系統構架中,把「傳統報紙生產、數字資產管理、電子報生成、光碟出版、全文資料庫形成和網絡發布」等作業融為一體,實現跨媒體的多元出版;通過一系列的技術集成,把「文章、版式、圖片、廣告、報花、字體、字號」等報紙涵蓋的所有信息,完整地結合在一起,再現版面語言的魅力;而精心設計的、更為友善的交互平臺,把數位化閱讀的愉悅包容其中,正在努力超越新聞紙的墨香。
從報業實際出發的跨媒體出版系統,目前已經在浙報集團所屬《浙江日報》、《錢江晚報》、《新民生報》、《今日早報》、《美術報》、《浙江老年報》等報紙中全面部署應用,並通過浙江在線(WWW.ZJDAILY.COM.CN)正式對外發布。
跨媒體出版帶來高效率
從平面媒體轉到數字媒體,實際上是新聞信息展現形式的轉變。根本上講,是信息資源的重新組織。
傳統報紙生產、數字資產管理、電子報生成、光碟出版、全文資料庫形成、網絡發布,以及採編人員業績考核系統、通訊員稿酬發放系統、稿件的統計分析系統,在數據組織上,有相當高的重合性和互補性。長期以來,由於技術的局限、管理體制的局限和標準化問題的障礙,信息資源的整合十分困難,更談不上跨媒體出版。
在「跨媒體出版暨數字報刊自動生成系統」中,以信息資源的集中管理為核心,通過流程優化,結合跨系統的技術集成與數據交換,完成一系列的技術創新,帶來多方面的高效率。
首先,當報紙排版完畢,只需要十分鐘左右時間,就能自動生成數字報刊和符合數字圖書標準的CEB文件,可以在內部網絡中提供閱覽,而相關數字資產實現自動歸檔,同步進入內部資料庫,與歷史報刊數據實現一體化管理。
其二,系統根據設定的時間,自動向網站伺服器提交成品文件。在技術層面看,網站發布的時間提前了6到8個小時,遠遠早於開印時間。
其三,在同步實施方正暢流系統的情況下,最終版面文件全部採用PDF格式,文件量相對PS方式大大減少,明顯縮短衛星傳版時間,印刷開機時間因此也有了15到20分鐘的提前。
其四,如果報社需要出版報紙數據光碟,可以在截至日當天的凌晨就完成母盤的製作,這是以前不可能做到的。
同樣的原因,系統能夠在第一時間向「採編人員業績考核系統」和「通訊員稿酬發放系統」發送完整、準確的稿件條目數據,從而減少大量人力,為「稿費日清」創造可能。
數字報刊系統生成的數字報刊頁面是靜態的html文件,通過腳本文件中的參數設置,可以方便地開啟或屏蔽頁面中的某些功能,如果在數字報刊系統所部署的網絡環境中存在與某個功能相關的系統,則可設置成打開該功能,否則,如果不存在相關的系統,就屏蔽該功能。從而確保數字報刊頁面可以在多種環境中瀏覽、閱讀。這樣,數字報刊頁面不僅可以部署在區域網中,而且可以部署在網際網路上、政府專網、圖書館上,也可以在報社內網中使用。同樣,這些數字報刊系統文件還可以直接刻錄到CD或DVD上,製作成數字報刊光碟或者以數字圖書的標準形式進入市場。
流程再造實現自動化
在傳統流程中,電子報紙的形成完全是基於PS格式分析,由於PS格式文件包含的信息比較少,要實現完全自動化的準確反解是不可能的,要提高智能化分析水平也相當有限。在這種技術背景下,報社需要大量的人工進行專門的數據標引和檢查,導致效率低、成本高,也容易出現差錯。
要解決數字報刊相關信息的完整、準確性和自動化問題,必須與新聞生產的各個環節打通,直接從源頭獲取準確的數據。為了實現這一設想,需要在新聞採編系統、飛騰排版系統、雷射照排或暢流系統中,加入大量信息獲取點。
首先,在採編系統和排版系統架構「網絡組版插件」,將採編系統和飛騰排版系統連接起來,獲取文章內容、標題、作者(包括記者所在部門、通訊員的地址等)、編輯等稿件相關屬性,為數字報刊系統也為考核系統、稿酬處理系統提供數據。
在飛騰排版環節,需要記錄文章、圖片、廣告、報花的內容、標題等方面的組成和修改,以及在排版後期才能確定版次、版面名稱、見報日期以及組版編輯和籤發人等信息。當排版結束,通過飛騰的「提交傳版」操作後,系統將版面信息、稿件信息以及區域定位信息立刻回寫到相關系統中。
另外,專門設計的「飛旋標引系統」直接嵌入到飛騰排版軟體中,除了解決相關信息的自動獲取外,也提供了人機互動的界面,為標引和檢查相關信息提供平臺。
通過調用方正暢流系統生成的PDF文件,以及版面JPG文件和局部圖像JPG文件,實現相關數據的自動生成和歸檔,完全不需要人工幹預。
實踐證明,在新聞採編系統、排版系統和照排系統中,我們能夠獲取數字報刊自動生成所需要的幾乎所有的信息。
通過流程再造,使得大部分信息已經正確「就位」,減少了人工操作。根據統計,平均每個版只需要增加1分鐘不到的標引工作,但由於整個流程的優化,組版人員在其他方面的工作可以節省了3到5分鐘。
原來負責標引操作的人員,現在可以完全節省了。同時,由於組版員對版面內稿件的組織、布局比較熟悉,所以準確性大大提高。
解決「開天窗」問題
國內大多數報社都採用飛騰軟體排版,其最後的產品是PS文件,由於PS文件的閱讀和再利用的障礙,無法通過網絡直接對外發布版面。此前,我們採用「文易系統」進行數據格式轉換,生成版面PDF文件。但遺憾的是,這種方式生成的文件不能保證精確完整,經常發現廣告或報花丟失,出現版面「開天窗」的情況。這種有嚴重缺陷的文件,以報社的名義正式對外發布是危險的。
北大方正的暢流系統,可能是近年來傳媒行業最重要的一次技術革命,它在解決報紙出版安全問題的同時,為報業數字資產管理以及跨媒體出版系統奠定了基礎。
採用「暢流系統」後,這個問題從根本上得到了解決。在「暢流系統」中生成的版面PDF文件,採用自包含技術,一個版一個文件,包含了版面上的全部關聯文件信息,不會缺圖、缺字體、缺廣告,可以直接用於閱讀、列印和印刷,是版面信息完全保存的理想載體,這是一個非常重大的變化。
經過暢流系統生成的版面PDF文件,都是經過加密的,只有安裝了密鑰的代印點才能正常閱讀和出片,否則即使複製了也無法打開。網站上發布供免費閱讀的電子版,則通過暢流系統專門的設計,生成閱讀用、低精度的PDF文件以及帶區域定位的版面JPG文件,可以很好地滿足數字報刊和內部數字資產管理系統的要求。
暢流系統還可以根據標引的要求,自動生成局部的JPG圖像文件。利用這一技術,還同步實現了「電子剪報」的功能和效果。
實現廣告的完整上網
目前國內的電子報,很少有把廣告上網的,在數字報刊系統的研究中,關於如何解決版面中的報頭、報花、題圖、導讀、表格、分類廣告等各類不規則內容的網頁呈現,一度成為無法逾越的難題。
我們最終設想把這些零碎的信息組合,用生成局部圖像的方式在網頁中呈現,使這一系列複雜的問題得到統一的解決,方正暢流系統提供了高效率的解決方案,實際效果非常理想。
以版面為中心的閱讀體驗
與以往採用PDF文件表現版面信息不同,在數字報刊系統中,採用高壓縮比的JPG版面圖的呈現,達到打開頁面就能看到版面的效果,「版面圖」成為界面的視覺中心。同時,在JPG版面圖實現文章、圖片、廣告區域的自動定位,自動生成對應內容的網頁連結。
數字報刊系統由於直接與先進的方正「暢流」系統實現數據交換,在完整版面圖像、局部版面圖像自動生成方面取得重大突破,因而在涵蓋內容、呈現形式等方面,相對傳統電子報有非常大的突破。
在文件格式上,系統根據需要分別提供HTML、JPG、PDF和CEB等四種類型文件,其中CEB格式支持數字圖書的標準。
在布局上,大致分為三個區域,左側是本版導航區,中間是整報導航區,右側為檢索功能區和連結區。在本版導航區,按次序排列本版的全部文章標題;在整報導航區,按次序排列報紙全部版面的版次和版面名稱。
總體上的色彩搭配給人以和諧、柔和、莊重的感受,適於在線閱讀。
人機互動與數位化閱讀
數字報刊系統在人機互動環境的設計上,力圖延續並超越傳統報紙的閱讀習慣。
首先,在技術平臺的選擇上,採用當前最流行的B/S結構,採用通用的網頁瀏覽器,不需要安裝任何專用軟體,閱讀者無須學習和適應。以靜態頁面作為主要的發布形式,還同時保證了較高的響應速度,避免用資料庫實時生成頁面的時間滯後,向閱讀者提供高速的信息交互。
在導航設計方面,要儘可能防止訪問者「迷路」。該系統的導航分為四個層次,三個模塊。第一個層次是每期報紙之間的導航;第二個層次是同期報紙不同版面間的導航;第三個層次是同一版面不同稿件間的導航;第四個層次是各種功能鍵的導航。三個模塊為日期導航模塊、版面圖導航模塊和文字鏈導航模塊。整體上講,做到了簡潔明了。
過多的點擊層次,會引起用戶煩躁,因此我們設置了兩層結構,第一層是版面層,第二層就直接進入內容瀏覽。除了整版廣告顯示不得不採用三層結構以外,其餘內容全部限定在兩層以內,使用戶在瀏覽信息時做到點擊次數的最少化。
數字報刊系統提供了三種內容閱讀方式:
1、通過點擊版面圖的區域來閱讀文章。
2、通過點擊文章標題來閱讀文章。
3、還可以打開版面的PDF文件來閱讀報紙。
數字報刊系統集成了網頁瀏覽的多種功能,如文章內容及圖片的放大、縮小,上下篇、上下版、上下期的方便跳轉,還提供了日曆跳轉、指定日期查看等功能。
系統特別設計了「轉版合成處理」、「豎排文字處理」等功能,實現與計算機語音合成系統的集成,實現在線朗讀,力圖為閱讀者提供了最大程度的便利。
靜態頁面與資料庫技術的集成
數字報刊系統採用靜態頁面與動態資料庫相結合的模式,把兩者的好處結合在一起。
為了滿足訪問者在閱覽時對響應速度的要求,便於調整頁面設計風格,便於向網站傳送數據,為了適應內部網絡、政府專網、網際網路以及光碟出版的個性化要求,採用靜態頁面的方式是必然的選擇。
但為了解決全文檢索系統、閱讀者發表評論、稿件版面統計分析、內部數字資產管理等其他方面的要求,我們必須保留並發揮資料庫的特長。
在數字報刊的生產流程中,也充分體現了資料庫與靜態文件相結合的思想。首先,採編系統是完全採用資料庫管理,採編人員績效考核、通訊員稿酬發放處理是採用資料庫管理,在飛騰排版、衛星傳版和照排出片方面是文件管理,版面標引是基於資料庫的,標引結果又是生成XML文件。圖片、廣告的處理也是採用文件與資料庫相結合的形式。最終,採用方正翔宇系統把XML文件入庫,再通過模板設置,自動完成數字報刊靜態頁面文件的生成。
由於考慮到多種文件類型管理與多種資料庫管理方式的並存需要,系統設計中充分考慮了數據交換和轉換的規範性要求,因而具有靈活適應和結構開放的特點,可以支持各種類型的全文檢索系統,可以不斷拓展新的功能。
功能配套與深度拓展
數字報刊系統除了包含最為核心的「跨媒體出版暨數字報刊自動生成系統」以外,還包括「數字報刊閱讀和評論系統」、「全文檢索系統」、「數字報刊指向和導航系統」、「數字報刊朗讀系統」、「數字報刊信息聚類加工系統」、「數字報刊訪問統計分析系統」,「數字報刊廣告位管理與發布系統」。
在系統後臺,實現與「新聞採編系統」、「飛騰排版系統」、「暢流系統」、「淵博系統」、「企業信息門戶系統」、「採編人員績效考核系統」、「通訊員稿酬發放系統」的數據交換和系統關聯,利用「飛旋標引系統」和「翔宇網站內容管理系統」實現數據生成,也可以掛接方正Apabi網絡出版系統實現電子圖書(相當於報紙合訂本)的自動生成。
數字報刊系統還設計了專門的「數據發布和追加通道」、「數據糾正和變更程序」以及「數據適應性定製工具」。
數字報刊系統的研究與開發,解決了報刊產品數位化的問題,在技術上有了充分的積累和準備,同時也開啟了跨媒體融合的技術空間。在二期工程中,將重點解決「數據報刊」與「數位電視」、「數字圖書館」的跨煤體融合問題,以及解決落實「按篇收費」概念的「數字報刊訂閱與收費管理系統」。
數字報刊,雖然還只是數字媒體的一個方面、一條通道、或者是一個開端。但我們相信,從新聞紙到數字報刊,這是一個新的歷史起點。
(作者單位:徐 萍 浙江樹人大學網絡新聞傳播教研室
樓險峰 浙江日報報業集團信息技術處)