21世紀Web資料庫的發展

2020-12-15 中關村在線

  進入70年代後,在社會大系統中出現了巨大的信息流和與之相伴的宏大的數據流,為了適應和滿足社會發展的需要,必須採用新的技術和手段來對這些數據進行收集、存儲、加工、檢索、分類、統計和傳輸等,於是資料庫技術不可避免地產生了。由於計算機被廣泛地應用於數據管理領域以及網際網路的迅速普及,人們對數據共享和聯機實時處理的要求也越來越高,於是資料庫技術又在不斷地發展改進。

  一、WWW網絡環境下Web資料庫

  由於Web的易用性、實用性,它很快佔據了主導地位,目前已經成為使用最為廣泛、最有前途、最有魅力的信息傳播技術。不過,Web服務只是提供了Internet上信息交互的平臺,要想實現真正的Internet,就要將人、企業、社會與Internet融為一體,這就要靠信息化應用的實現。電子商務是以Web網絡技術和資料庫技術為支撐的,其中Web資料庫技術是電子商務的核心技術。支持電子商務已經成為各大廠商競爭的焦點,Web資料庫的發展成為新的熱點和難題。Web資料庫,就是能將資料庫技術與Web技術很好地融合在一起,使資料庫系統成為Web的重要有機組成部分的資料庫,能夠實現資料庫與網絡技術的無縫有機結合。

  目前,關係資料庫的應用範圍最廣,佔據了資料庫主流地位。關係資料庫最初設計為基於主機/終端方式的大型機上的應用,其應用範圍較為有限,隨著客戶機/伺服器方式的流行和應用向客戶機方的分解,關係資料庫又經歷了客戶機/伺服器時代,並獲得了極大的發展。隨著Internet應用的普及,由於Internet上信息資源的複雜性和不規範性,關係資料庫初期在開發各種網上應用時顯得力不從心,表現在無法管理各種網上的複雜的文檔型和多媒體型數據資源,後來關係資料庫對於這些需求作出了一些適應性調整,如增加資料庫的面向對象成分以增加處理多種複雜數據類型的能力,增加各種中間件(主要包括CGI、ISAPI、ODBC、JDBC、ASP等技術)以擴展基於Internet應用能力,通過應用伺服器解釋執行各種HTML中嵌入腳本來解決Internet應用中資料庫數據的顯示、維護、輸出以及到HTML的格式轉換等。此時關係資料庫的基於Internet應用的模式典型表現為一種三層或四層的多層結構。在這種多層結構體系下,關係資料庫解決了資料庫的Internet應用的方法問題,使得基於關係資料庫能夠開發各種網上資料庫數據的發布、檢索、維護、數據管理等一般性應用。

  但是我們可以說關係資料庫從設計之初並沒有也不可能考慮到以HTTP為基礎、HTML為文件格式的網際網路的需求,只是在網際網路出現後才作出相應的調整。同時,關係資料庫的基於中間件的解決方案又給Internet應用帶來了新的網絡瓶頸,應用伺服器端由於與資料庫頻繁交互,因其本身的效率和資料庫檢索的效率造成Internet應用在應用伺服器端的阻塞。

  雖然關係型資料庫具有完備的理論基礎、簡潔的數據模型、透明的查詢語言和方便的操作方法等優點,但是由於它本身並沒有針對網絡的特點和要求進行設計,因此並不適用於網絡環境,我們應該研究開發新的資料庫技術,從開始就考慮到Web的信息和結構特點,使資料庫真正能與Web融合為一體,充分利用二者的特點,建立合理的Web資料庫。

  二、Web資料庫的發展趨勢

  1.非結構化資料庫

  在信息社會,信息可以劃分為兩大類。一類信息能夠用數據或統一的結構加以表示,我們稱之為結構化數據,如數字、符號;而另一類信息無法用數字或統一的結構表示,如文本、圖像、聲音、網頁等,我們稱之為非結構化數據。結構化數據屬於非結構化數據,是非結構化數據的特例。

  隨著網絡技術的發展,特別是Internet和Intranet技術的飛快發展,使得非結構化數據的數量日趨增大。這時,主要用於管理結構化數據的關係資料庫的局限性暴露地越來越明顯。因而,資料庫技術相應地進入了「後關係資料庫時代」,發展進入基於網絡應用的非結構化資料庫時代。所謂非結構化資料庫,是指資料庫的變長紀錄由若干不可重複和可重複的欄位組成,而每個欄位又可由若干不可重複和可重複的子欄位組成。簡單地說,非結構化資料庫就是欄位可變的資料庫。

  我國非結構化資料庫以北京國信貝斯(iBase)軟體有限公司的iBase資料庫為代表。IBase資料庫是一種面向最終用戶的非結構化資料庫,在處理非結構化信息、全文信息、多媒體信息和海量信息等領域以及Internet/Intranet應用上處於國際先進水平,在非結構化數據的管理和全文檢索方面獲得突破。它主要有以下幾個優點:

  (1)Internet應用中,存在大量的複雜數據類型,iBase通過其外部文件數據類型,可以管理各種文檔信息、多媒體信息,並且對於各種具有檢索意義的文檔信息資源,如HTML、DOC、RTF、TXT等還提供了強大的全文檢索能力。

  (2)它採用子欄位、多值欄位以及變長欄位的機制,允許創建許多不同類型的非結構化的或任意格式的欄位,從而突破了關係資料庫非常嚴格的表結構,使得非結構化數據得以存儲和管理。

  (3)iBase將非結構化和結構化數據都定義為資源,使得非結構資料庫的基本元素就是資源本身,而資料庫中的資源可以同時包含結構化和非結構化的信息。所以,非結構化資料庫能夠存儲和管理各種各樣的非結構化數據,實現了資料庫系統數據管理到內容管理的轉化。

  (4)iBase採用了面向對象的基石,將企業業務數據和商業邏輯緊密結合在一起,特別適合於表達複雜的數據對象和多媒體對象。

  (5)iBase是適應Internet發展的需要而產生的資料庫,它基於Web是一個廣域網的海量資料庫的思想,提供一個網上資源管理系統iBase Web,將網絡伺服器(WebServer)和資料庫伺服器(Database Server)直接集成為一個整體,使資料庫系統和資料庫技術成為Web的一個重要有機組成部分,突破了資料庫僅充當Web體系後臺角色的局限,實現資料庫和Web的有機無縫組合,從而為在Internet/Intranet上進行信息管理乃至開展電子商務應用開闢了更為廣闊的領域。

  (6)iBase全面兼容各種大中小型的資料庫,對傳統關係資料庫,如Oracle、Sybase、SQLServer、DB2、Informix等提供導入和連結的支持能力。

  通過從上面的分析後我們可以預言,隨著網絡技術和網絡應用技術的飛快發展,完全基於Internet應用的非結構化資料庫將成為繼層次資料庫、網狀資料庫和關係資料庫之後的又一重點、熱點技術。

  2.異構資料庫系統

  由於歷史等原因,Internet上的資料庫系統不少是分布、異構的。Internet上大量信息必須通過資料庫系統才能有效管理。那麼,Internet環境下分布式海量信息情況下如何建立合理高效的海量資料庫,成為我們亟待解決的問題。針對目前關係型資料庫佔據了絕大多數市場的情況,要實現網絡環境下的海量信息共享,就必須聯合各個異構資料庫,使得資料庫之間能夠通過主動式的超文本連結,實現相互連接,使得交叉引用的數據可以被很容易地檢索到。

  相互關聯的資料庫可以很容易地被歸納在一起、創建一個單一的虛擬資料庫,也叫做異構資料庫系統。異構資料庫系統是相關的多個資料庫系統的集合,可以實現數據的共享和透明訪問,每個資料庫系統在加入異構資料庫系統之前本身就已存在,擁有自己的DBMS。它的異構性主要體現在以下幾個方面:計算機體系結構的異構;基礎作業系統的異構;DBMS本身的異構。它的目標在於實現不同資料庫之間的數據信息資源、硬體設備資源和人力資源的合併和共享。

  公司企業在Internet環境下實現電子商務,它的實際應用環境非常複雜,他們可能分布在不同的地理位置,使用不同的數據組織形式和作業系統平臺,加上應用不同所造成的數據不一致性問題,如何將這些高度分布的數據集中起來充分利用成為亟待解決的問題。建立在異構資料庫系統基礎上的數據倉庫技術便產生了。「數據倉庫是20世紀90年代信息技術構架的新焦點,它提供集成化和歷史化的數據,集成種類不同的應用系統,數據倉庫從事物發展和歷史的角度來組織和存儲數據,以供信息化和分析處理之用。它是集成的、以主題為嚮導的、不可更新的、隨時間不斷變化的數據集合。」數據倉庫可以從異構資料庫系統中的多個資料庫,並建立統一的全局模式,同時收集的數據還支持對歷史數據的訪問,用戶通過數據倉庫提供的統一的數據接口進行決策支持的查詢。在數據倉庫的基礎上,又可以進行數據挖掘、Web挖掘,實現真正地信息檢索查詢。

  目前,異構資料庫系統的集成以及建立此基礎之上的數據倉庫、數據挖掘已經成為網絡資料庫技術研究的重點之一。著名的國內外資料庫廠商也將異構資料庫系統作為競爭的焦點,研究如何將原來傳統的、可能分布於各地的多個關係資料庫集成起來,進行改進和發展,形成虛擬異構資料庫系統和數據倉庫,更好地企業信息化、電子商務服務。

  三、結束語

  最近幾年,我國的資料庫市場飛速發展,並將具有更為巨大的增長潛力。首先,在近幾年裡,電子商務成為各個公司企業發展的重心,甚至有人預言,電子商務極有可能建立起新型的虛擬商業,乃至虛擬工業。而電子商務是以資料庫技術和網絡技術為支撐的,其中資料庫技術是其核心。其次,有更多的用戶把資料庫的重要性放在十分重要的地位,其主要原因是用戶將把應用軟體和應用需求放在首位,而應用軟體開發直接依賴於資料庫開發工具。還有一個原因是硬體隨著晶片技術的發展越來越缺乏特性,硬體指標將變成次要的考慮因素。對行業性應用來講,而今可能是首選資料庫廠家再考慮硬體廠家了。正是用戶需求的這種變化給資料庫廠商提供了新的發展機會。所以可以預言,在不久的將來Web資料庫將成為資料庫領域研究的熱點技術。

 

相關焦點

  • 大話python,web.py教程之資料庫連接
    今天來說說web.py怎樣連接資料庫:在資料庫新建資料庫todo,然後添加表todoCREATE TABLE todo (id serial primary key,title text,created timestamp
  • 資料庫發展歷程
    發展歷程資料庫技術產生的背景:隨著數據管理任務的需要而產生。數據管理:指的是對數據進行分類、組織、編碼、存儲、檢索、維護。數據的處理:對數據進行收集、存儲、加工、傳播等一系列活動。資料庫管理技術經歷了三個階段:人工管理階段--文件系統管理階段--資料庫管理階段。
  • 《21世紀資本論》是21世紀《資本論》嗎?
    《21世紀資本論》是21世紀《資本論》嗎?習近平總書記對託馬斯·皮凱蒂和《21世紀資本論》也給予高度評價,「他的分析主要是從分配領域進行的,沒有過多涉及更根本的所有制問題,但得出的結論值得我們深思」。  從皮凱蒂的《21世紀資本論》的題目中,我們能直觀感受到其主題。而該書題目讓人好奇,此書與馬克思《資本論》之間是否具有某種淵源?
  • eMarketing : 21世紀營銷創新的焦點
    新關注: 全球營銷學者對21世紀的討論  在21世紀到來之前,21世紀的營銷理論和實踐究竟會如何發展,看法並不完全一致,進而關注的焦點也並不集中。另一件事是,著名世界營銷大師P.科特勒教授出版了他的代表性著作《市場營銷管理》   (MARKETING MANAGEMENT)的第10版,特稱為世紀版(The Millennium Edition ),與以前的各版本內容相比較,顯著的一個不同點是,他在世紀版中的最前面增加了新的一章,專門討論21世紀營銷的發展問題。
  • 21世紀海上合作委員會官網正式上線
    2020年12月31日上午,21世紀海上合作委員會官網上線啟動儀式以線上和線下相結合的方式舉行。啟動儀式由21世紀海上合作委員會和福州市人民政府主辦,中國人民對外友好協會(以下簡稱「全國對外友協」)副會長姜江先生、世界城市和地方政府聯合組織(以下簡稱「城地組織」)亞太區秘書長博娜蒂婭·坦德拉德薇博士通過Zoom平臺出席並致辭,福州市人民政府副市長、21世紀海上合作委員會秘書長杭東先生蒞臨委員會秘書處參加啟動儀式並致辭。
  • 21世紀中外行政程序法發展述評
    美國、歐盟的多數成員國乃至日本等國家在20世紀(初期、中期或後期)就制定了比較完善的行政程序法法典,所以在21世紀主要是修改和進一步完善,以及通過法院判例確立有關實施規則、原則的問題。中國在20世紀前期和中期,行政程序法基本處於空白狀態,改革開放以後才開始建立法制,21世紀行政程序法有了較大發展。儘管到現在為止還沒有制定出統一的行政程序法典,但已有越來越多的行政程序法單行法和地方行政程序規章出臺。
  • Web1.0與Web2.0和Web3.0的本質區別是什麼
    web2.0,再到用戶自主控制數據的web3.0。經過十多年的發展,web2.0的已經極大豐富。而web3.0才剛剛露出尖尖角,它以區塊鏈和加密貨幣為重要基礎,引導網際網路走向個人控制數據所有權,並實現個人隱私。但向真正走向web3.0,並非坦途,web2.0經過十多年的發展,由全世界如此眾多的聰明人不斷改進才取得今日的成就,而web3.0要成為主流採用的網絡,所需的時間也不可能短。
  • 在理論創新與實踐創新的良性互動中發展21世紀馬克思主義
    ,在現實邏輯上體現了在新時代發展創新21世紀馬克思主義的基本要求。  1.歷史使命:在理論創新與實踐創新的良性互動中發展21世紀馬克思主義的必然性  發展21世紀馬克思主義是解決21世紀時代課題、發展創新新時代中國特色社會主義、實現中華民族偉大復興實踐的必然要求,是馬克思主義中國化的必然進程。
  • ARTPRICE - The Museum Industry®:21 世紀的藝術展覽
    巴黎2019年3月8日 /美通社/ -- 如今,藝術傑作的價格正日漸超出公共博物館的較大採購預算; 因此,公共博物館被迫尋找新的發展方式。面對財力更雄厚、行動更靈活的企業基金會和私人收藏家,國家機構必須努力尋求受市場趨勢影響較小的長期項目。
  • 從Web2.0走向Web3.0:還有多遠?
    前言:網際網路的範式不斷迭代升級,從只有靜態網頁的web1. 0 到用戶直接交互的web2.0,再到用戶自主控制數據的web3.0。經過十多年的發展,web2. 0 的已經極大豐富。而web3. 0 才剛剛露出尖尖角,它以區塊鏈和加密貨幣為重要基礎,引導網際網路走向個人控制數據所有權,並實現個人隱私。
  • 從Web2.0走向Web3.0:還有多遠?
    前言:網際網路的範式不斷迭代升級,從只有靜態網頁的web1.0到用戶直接交互的web2.0,再到用戶自主控制數據的web3.0。經過十多年的發展,web2.0的已經極大豐富。而web3.0才剛剛露出尖尖角,它以區塊鏈和加密貨幣為重要基礎,引導網際網路走向個人控制數據所有權,並實現個人隱私。
  • Web滲透測試——Mysql資料庫手工注入
    SQL注入原理當我們的Web在向後臺資料庫傳遞SQL語句進行資料庫操作時。如果對用戶輸入的參數沒有經過嚴格的過濾處理,那麼攻擊者就可以構造特殊的SQL語句,直接輸入資料庫引擎執行,獲取或修改資料庫中的數據。
  • Oracle 資料庫 21c 來了!
    甲骨文公司宣布在 Oracle 雲中推出新版本的全球領先融合資料庫Oracle 資料庫 21c。不同於雲端或本地部署環境中的其他同類資料庫,Oracle 資料庫 21c 可基於統一的現代融合資料庫引擎,滿足多模型、多負載和多租戶需求。
  • 用新技術研究地球寶藏——談21世紀礦物學的發展和走向
    □ 中科院地化所研究員 陳豐    人類的生存和發展離不開礦物。在歷史上,人們通過對礦物的開採和利用不斷豐富了礦物學的內容,而21世紀世界礦物學的發展趨勢和走向如何呢?    預測21世紀的科學,乃至於某一學科的進展,有相當大的困難。20世紀礦物學是沿下列方向發展:1.礦物學是地質科學的基礎學科。2.地質科學中與數理化聯繫最密切的分支學科。
  • 一篇文章搞定MySQL資料庫基本概念
    概述資料庫(Database,簡稱DB)資料庫技術是計算機應用領域中非常重要的技術,它產生於20世紀60年代末,是數據管理的最新技術,也是軟體技術的一個重要分支。 從二十世紀六十年代開始,第一代資料庫系統(層次模型資料庫系統、網狀模型資料庫系統)相繼問世,它們為統一管理和共享數據提供了有力的支撐在這個階段,網狀模型資料庫由於它的複雜、專用性,沒有被廣泛使用。
  • 21世紀亞洲金融年會在京成功舉辦 21世紀亞洲金融競爭力評選揭曉
    21世紀亞洲金融年會,與炫麗了整季的北京,相遇在11月。2020年11月10-11日,第十五屆21世紀亞洲金融年會在北京成功舉辦,21世紀亞洲金融競爭力評選在年會尾聲揭曉。 本屆金融年會以「開放金融 智創未來」為主題,吸引了上百位監管機構代表、權威專家、知名金融機構高層、實業企業家等財經人士共聚一堂,深度探討金融新浪潮。
  • 除了華為、阿里自研資料庫,還有哪些國產資料庫?發展狀況如何?
    到了20世紀50年代,隨著作業系統的出現,新的數據處理系統迅猛發展起來,誕生了專門管理數據的系統。不過那時的數據系統是一種存儲離散數據類似文件櫃的文件系統。1964年,美國系統發展公司在為美國海軍基地研製數據系統時首先使用了「DataBase」,用以表示由分時共享計算機系統終端用戶共享的數據集合,計算機資料庫正式進入結構化時代。
  • 最新技術讓excel秒變web資料庫
    另外通過Excel收集各種數據質量也比較差,由於大家填寫Excel不是通過基於資料庫的選的方式,而是隨意複製粘貼,有時候多一個字,有時候少一個字,後面做統計分析的時候就非常不方便。這就是魔方網表,學起來很簡單,用起來很強大,使用它可以將Excel變成Web資料庫應用:
  • 2020第十五屆21世紀亞洲金融年會在京成功舉辦 21世紀亞洲金融競爭...
    21世紀亞洲金融年會,與炫麗了整季的北京,相遇在11月。2020年11月10-11日,第十五屆21世紀亞洲金融年會在北京成功舉辦,21世紀亞洲金融競爭力評選在年會尾聲揭曉。本屆金融年會以「開放金融 智創未來」為主題,吸引了上百位監管機構代表、權威專家、知名金融機構高層、實業企業家等財經人士共聚一堂,深度探討金融新浪潮。
  • 它為何是「21世紀最性感的工作」?一文讀懂數據科學的發展
    雖然直到最近,「數據科學(Data Science)」 一詞才被人們所廣泛熟知,但事實上,人類理解數據的歷史由來已久,並且已經由科學家、統計學家、計算機科學家等專業人員共同推動發展了多年。同年,Usama Fayyad,Gregory Piatetsky-Shapiro 和 Padhraic Smyth 發表了 「從數據挖掘到資料庫知識發現」。