進入70年代後,在社會大系統中出現了巨大的信息流和與之相伴的宏大的數據流,為了適應和滿足社會發展的需要,必須採用新的技術和手段來對這些數據進行收集、存儲、加工、檢索、分類、統計和傳輸等,於是資料庫技術不可避免地產生了。由於計算機被廣泛地應用於數據管理領域以及網際網路的迅速普及,人們對數據共享和聯機實時處理的要求也越來越高,於是資料庫技術又在不斷地發展改進。
一、WWW網絡環境下Web資料庫
由於Web的易用性、實用性,它很快佔據了主導地位,目前已經成為使用最為廣泛、最有前途、最有魅力的信息傳播技術。不過,Web服務只是提供了Internet上信息交互的平臺,要想實現真正的Internet,就要將人、企業、社會與Internet融為一體,這就要靠信息化應用的實現。電子商務是以Web網絡技術和資料庫技術為支撐的,其中Web資料庫技術是電子商務的核心技術。支持電子商務已經成為各大廠商競爭的焦點,Web資料庫的發展成為新的熱點和難題。Web資料庫,就是能將資料庫技術與Web技術很好地融合在一起,使資料庫系統成為Web的重要有機組成部分的資料庫,能夠實現資料庫與網絡技術的無縫有機結合。
目前,關係資料庫的應用範圍最廣,佔據了資料庫主流地位。關係資料庫最初設計為基於主機/終端方式的大型機上的應用,其應用範圍較為有限,隨著客戶機/伺服器方式的流行和應用向客戶機方的分解,關係資料庫又經歷了客戶機/伺服器時代,並獲得了極大的發展。隨著Internet應用的普及,由於Internet上信息資源的複雜性和不規範性,關係資料庫初期在開發各種網上應用時顯得力不從心,表現在無法管理各種網上的複雜的文檔型和多媒體型數據資源,後來關係資料庫對於這些需求作出了一些適應性調整,如增加資料庫的面向對象成分以增加處理多種複雜數據類型的能力,增加各種中間件(主要包括CGI、ISAPI、ODBC、JDBC、ASP等技術)以擴展基於Internet應用能力,通過應用伺服器解釋執行各種HTML中嵌入腳本來解決Internet應用中資料庫數據的顯示、維護、輸出以及到HTML的格式轉換等。此時關係資料庫的基於Internet應用的模式典型表現為一種三層或四層的多層結構。在這種多層結構體系下,關係資料庫解決了資料庫的Internet應用的方法問題,使得基於關係資料庫能夠開發各種網上資料庫數據的發布、檢索、維護、數據管理等一般性應用。
但是我們可以說關係資料庫從設計之初並沒有也不可能考慮到以HTTP為基礎、HTML為文件格式的網際網路的需求,只是在網際網路出現後才作出相應的調整。同時,關係資料庫的基於中間件的解決方案又給Internet應用帶來了新的網絡瓶頸,應用伺服器端由於與資料庫頻繁交互,因其本身的效率和資料庫檢索的效率造成Internet應用在應用伺服器端的阻塞。
雖然關係型資料庫具有完備的理論基礎、簡潔的數據模型、透明的查詢語言和方便的操作方法等優點,但是由於它本身並沒有針對網絡的特點和要求進行設計,因此並不適用於網絡環境,我們應該研究開發新的資料庫技術,從開始就考慮到Web的信息和結構特點,使資料庫真正能與Web融合為一體,充分利用二者的特點,建立合理的Web資料庫。
二、Web資料庫的發展趨勢
1.非結構化資料庫
在信息社會,信息可以劃分為兩大類。一類信息能夠用數據或統一的結構加以表示,我們稱之為結構化數據,如數字、符號;而另一類信息無法用數字或統一的結構表示,如文本、圖像、聲音、網頁等,我們稱之為非結構化數據。結構化數據屬於非結構化數據,是非結構化數據的特例。
隨著網絡技術的發展,特別是Internet和Intranet技術的飛快發展,使得非結構化數據的數量日趨增大。這時,主要用於管理結構化數據的關係資料庫的局限性暴露地越來越明顯。因而,資料庫技術相應地進入了「後關係資料庫時代」,發展進入基於網絡應用的非結構化資料庫時代。所謂非結構化資料庫,是指資料庫的變長紀錄由若干不可重複和可重複的欄位組成,而每個欄位又可由若干不可重複和可重複的子欄位組成。簡單地說,非結構化資料庫就是欄位可變的資料庫。
我國非結構化資料庫以北京國信貝斯(iBase)軟體有限公司的iBase資料庫為代表。IBase資料庫是一種面向最終用戶的非結構化資料庫,在處理非結構化信息、全文信息、多媒體信息和海量信息等領域以及Internet/Intranet應用上處於國際先進水平,在非結構化數據的管理和全文檢索方面獲得突破。它主要有以下幾個優點:
(1)Internet應用中,存在大量的複雜數據類型,iBase通過其外部文件數據類型,可以管理各種文檔信息、多媒體信息,並且對於各種具有檢索意義的文檔信息資源,如HTML、DOC、RTF、TXT等還提供了強大的全文檢索能力。
(2)它採用子欄位、多值欄位以及變長欄位的機制,允許創建許多不同類型的非結構化的或任意格式的欄位,從而突破了關係資料庫非常嚴格的表結構,使得非結構化數據得以存儲和管理。
(3)iBase將非結構化和結構化數據都定義為資源,使得非結構資料庫的基本元素就是資源本身,而資料庫中的資源可以同時包含結構化和非結構化的信息。所以,非結構化資料庫能夠存儲和管理各種各樣的非結構化數據,實現了資料庫系統數據管理到內容管理的轉化。
(4)iBase採用了面向對象的基石,將企業業務數據和商業邏輯緊密結合在一起,特別適合於表達複雜的數據對象和多媒體對象。
(5)iBase是適應Internet發展的需要而產生的資料庫,它基於Web是一個廣域網的海量資料庫的思想,提供一個網上資源管理系統iBase Web,將網絡伺服器(WebServer)和資料庫伺服器(Database Server)直接集成為一個整體,使資料庫系統和資料庫技術成為Web的一個重要有機組成部分,突破了資料庫僅充當Web體系後臺角色的局限,實現資料庫和Web的有機無縫組合,從而為在Internet/Intranet上進行信息管理乃至開展電子商務應用開闢了更為廣闊的領域。
(6)iBase全面兼容各種大中小型的資料庫,對傳統關係資料庫,如Oracle、Sybase、SQLServer、DB2、Informix等提供導入和連結的支持能力。
通過從上面的分析後我們可以預言,隨著網絡技術和網絡應用技術的飛快發展,完全基於Internet應用的非結構化資料庫將成為繼層次資料庫、網狀資料庫和關係資料庫之後的又一重點、熱點技術。
2.異構資料庫系統
由於歷史等原因,Internet上的資料庫系統不少是分布、異構的。Internet上大量信息必須通過資料庫系統才能有效管理。那麼,Internet環境下分布式海量信息情況下如何建立合理高效的海量資料庫,成為我們亟待解決的問題。針對目前關係型資料庫佔據了絕大多數市場的情況,要實現網絡環境下的海量信息共享,就必須聯合各個異構資料庫,使得資料庫之間能夠通過主動式的超文本連結,實現相互連接,使得交叉引用的數據可以被很容易地檢索到。
相互關聯的資料庫可以很容易地被歸納在一起、創建一個單一的虛擬資料庫,也叫做異構資料庫系統。異構資料庫系統是相關的多個資料庫系統的集合,可以實現數據的共享和透明訪問,每個資料庫系統在加入異構資料庫系統之前本身就已存在,擁有自己的DBMS。它的異構性主要體現在以下幾個方面:計算機體系結構的異構;基礎作業系統的異構;DBMS本身的異構。它的目標在於實現不同資料庫之間的數據信息資源、硬體設備資源和人力資源的合併和共享。
公司企業在Internet環境下實現電子商務,它的實際應用環境非常複雜,他們可能分布在不同的地理位置,使用不同的數據組織形式和作業系統平臺,加上應用不同所造成的數據不一致性問題,如何將這些高度分布的數據集中起來充分利用成為亟待解決的問題。建立在異構資料庫系統基礎上的數據倉庫技術便產生了。「數據倉庫是20世紀90年代信息技術構架的新焦點,它提供集成化和歷史化的數據,集成種類不同的應用系統,數據倉庫從事物發展和歷史的角度來組織和存儲數據,以供信息化和分析處理之用。它是集成的、以主題為嚮導的、不可更新的、隨時間不斷變化的數據集合。」數據倉庫可以從異構資料庫系統中的多個資料庫,並建立統一的全局模式,同時收集的數據還支持對歷史數據的訪問,用戶通過數據倉庫提供的統一的數據接口進行決策支持的查詢。在數據倉庫的基礎上,又可以進行數據挖掘、Web挖掘,實現真正地信息檢索查詢。
目前,異構資料庫系統的集成以及建立此基礎之上的數據倉庫、數據挖掘已經成為網絡資料庫技術研究的重點之一。著名的國內外資料庫廠商也將異構資料庫系統作為競爭的焦點,研究如何將原來傳統的、可能分布於各地的多個關係資料庫集成起來,進行改進和發展,形成虛擬異構資料庫系統和數據倉庫,更好地企業信息化、電子商務服務。
三、結束語
最近幾年,我國的資料庫市場飛速發展,並將具有更為巨大的增長潛力。首先,在近幾年裡,電子商務成為各個公司企業發展的重心,甚至有人預言,電子商務極有可能建立起新型的虛擬商業,乃至虛擬工業。而電子商務是以資料庫技術和網絡技術為支撐的,其中資料庫技術是其核心。其次,有更多的用戶把資料庫的重要性放在十分重要的地位,其主要原因是用戶將把應用軟體和應用需求放在首位,而應用軟體開發直接依賴於資料庫開發工具。還有一個原因是硬體隨著晶片技術的發展越來越缺乏特性,硬體指標將變成次要的考慮因素。對行業性應用來講,而今可能是首選資料庫廠家再考慮硬體廠家了。正是用戶需求的這種變化給資料庫廠商提供了新的發展機會。所以可以預言,在不久的將來Web資料庫將成為資料庫領域研究的熱點技術。