數據模型概念及類型劃分

2021-01-08 電子產品世界
數據(data)是描述事物的符號記錄。模型(Model)是現實世界的抽象。數據模型(Data Model)是數據特徵的抽象,是資料庫管理的教學形式框架。資料庫系統中用以提供信息表示和操作手段的形式構架。數據模型包括資料庫數據的結構部分、資料庫數據的操作部分和資料庫數據的約束條件

  內容  

數據模型所描述的內容包括三個部分:數據結構、數據操作、數據約束。

  1)數據結構:數據模型中的數據結構主要描述數據的類型、內容、性質以及數據間的聯繫等。數據結構是數據模型的基礎,數據操作和約束都建立在數據結構上。不同的數據結構具有不同的操作和約束。

  2)數據操作:數據模型中數據操作主要描述在相應的數據結構上的操作類型和操作方式。

  3)數據約束:數據模型中的數據約束主要描述數據結構內數據間的語法、詞義聯繫、他們之間的制約和依存關係,以及數據動態變化的規則,以保證數據的正確、有效和相容。

  類型

  數據模型按不同的應用層次分成三種類型:分別是概念數據模型、邏輯數據模型、物理數據模型。

  1、概念數據模型(Conceptual Data Model):簡稱概念模型,是面向資料庫用戶的實現世界的模型,主要用來描述世界的概念化結構,它使資料庫的設計人員在設計的初始階段,擺脫計算機系統及DBMS的具體技術問題,集中精力分析數據以及數據之間的聯繫等,與具體的數據管理系統(Database Management System,簡稱DBMS)無關。概念數據模型必須換成邏輯數據模型,才能在DBMS中實現。

  2、邏輯數據模型(Logical Data Model):簡稱數據模型,這是用戶從資料庫所看到的模型,是具體的DBMS所支持的數據模型,如網狀數據模型(Network Data Model)、層次數據模型(Hierarchical Data Model)等等。此模型既要面向用戶,又要面向系統,主要用於資料庫管理系統(DBMS)的實現。

  3、物理數據模型(Physical Data Model):簡稱物理模型,是面向計算機物理表示的模型,描述了數據在儲存介質上的組織結構,它不但與具體的DBMS有關,而且還與作業系統和硬體有關。每一種邏輯數據模型在實現時都有起對應的物理數據模型。DBMS為了保證其獨立性與可移植性,大部分物理數據模型的實現工作又系統自動完成,而設計者只設計索引、聚集等特殊結構。

  在概念數據模型中最常用的是E-R模型、擴充的E-R模型、面向對象模型及謂詞模型。在邏輯數據類型中最常用的是層次模型、網狀模型、關係模型。

  資料庫領域採用的數據模型有層次模型、網狀模型和關係模型,其中應用最廣泛的是關係模型。

  層次模型:它的特點是將數據組織成一對多關係的結構。

  層次結構採用關鍵字來訪問其中每一層次的每一部分。

  優點:

  存取方便且速度快

  結構清晰,容易理解

  數據修改和資料庫擴展容易實現

  檢索關鍵屬性十分方便

  缺陷:

  結構呆板,缺乏靈活性

  同一屬性數據要存儲多次,數據冗餘大(如公共邊)

  不適合於拓撲空間數據的組織

  網狀模型用連接指令或指針來確定數據間的顯式連接關係,是具有多對多類型的數據組織方式

  優點:

  能明確而方便地表示數據間的複雜關係

  數據冗餘小

  缺陷:

  網狀結構的複雜,增加了用戶查詢和定位的困難。

  需要存儲數據間聯繫的指針,使得數據量增大

  數據的修改不方便(指針必須修改)

  關係資料庫模型是以記錄組或數據表的形式組織數據,以便於利用各種地理實體與屬性之間的關係進行存儲和變換,不分層也無指針,是建立空間數據和屬性數據之間關係的一種非常有效的數據組織方法

  優點:

  結構特別靈活,滿足所有布爾邏輯運算和數學運算規則形成的查詢要求

  能搜索、組合和比較不同類型的數據

  增加和刪除數據非常方便

  缺陷:

  資料庫大時,查找滿足特定關係的數據費時

  對空間關係無法滿足

  數據結構

  數據結構是目標類型的集合。目標類型是資料庫的組成成分,一般可分為兩類:數據類型、數據類型之間的聯繫。數據類型如DBTG(資料庫任務組)網狀模型中的記錄型、數據項,關係模型中的關係、域等。聯繫部分有DBTG網狀模型中的系型等。數據操作部分是操作算符的集合,包括若干操作和推理規則,用以對目標類型的有效實例所組成的資料庫進行操作。數據約束條件是完整性規則的集合,用以限定符合數據模型的資料庫狀態,以及狀態的變化。約束條件可以按不同的原則劃分為數據值的約束和數據間聯繫的約束;靜態約束和動態約束;實體約束和實體間的參照約束等。

  概念的發展

  隨著資料庫學科的發展,數據模型的概念也逐漸深入和完善。早期,一般把數據模型僅理解為數據結構。其後,在一些資料庫系統中,則把數據模型歸結為數據的邏輯結構、物理配置、存取路徑和完整性約束條件等四個方面。現代數據模型的概念,則認為數據結構只是數據模型的組成成分之一。數據的物理配置和存取路徑是關於數據存儲的概念,不屬於數據模型的內容。此外,數據模型不僅應該提供數據表示的手段,還應該提供數據操作的類型和方法,因為資料庫不是靜態的而是動態的。因此,數據模型還包括數據操作部分。

  三種重要模型

  層次模型、網狀模型和關係模型是三種重要的數據模型。這三種模型是按其數據結構而命名的。前兩種採用格式化的結構。在這類結構中實體用記錄型表示,而記錄型抽象為圖的頂點。記錄型之間的聯繫抽象為頂點間的連接弧。整個數據結構與圖相對應。對應於樹形圖的數據模型為層次模型;對應於網狀圖的數據模型為網狀模型。關係模型為非格式化的結構,用單一的二維表的結構表示實體及實體之間的聯繫。滿足一定條件的二維表,稱為一個關係(見關係資料庫)。

  格式化模型可以描述複雜的數據結構,用存取路徑實現數據間的聯繫。從60年代後期以來,在各種計算機系統上建立了許多層次模型和網狀模型的資料庫管理系統。這些系統成功地應用於數據處理。但這類系統具有以下缺點。首先是使用了許多與數據操作任務無關的概念,如DBTG系統中的系,用戶必須按照存取路徑存取資料庫中的數據。其次,不支持集合處理,即未提供一次處理多個記錄的功能。第三,沒有充分認識端點用戶直接與資料庫對話的需求,缺乏為適應非預期查詢而增加系統設施的能力。這些缺點降低了程序和數據的獨立性,影響應用程式員的工作效率,限制端點用戶對資料庫的使用。

  關係模型嚴格符合現代數據模型的定義。數據結構簡單清晰。存取路徑完全向用戶隱蔽,使程序和數據具有高度的獨立性。關係模型的數據語言非過程化程度較高,用戶性能好,具有集合處理能力,並有定義、操縱、控制一體化的優點。關係模型中,結構、操作和完整性規則三部分聯繫緊密。關係資料庫系統為提高程式設計師的生產率,以及端點用戶直接使用資料庫提供了一個現實基礎。

  關係模型研究的一個課題,是擴展關係模型和把數據模型形式化。1981年提出可把數據模型看成是抽象的程序設計語言。資料庫是變量,資料庫模式是變量的類型。資料庫狀態是某類變量所取的值。數據定義語言給出說明資料庫變量的語法,數據操縱語言是數據模型中操作類型的具體實現,而資料庫管理系統是某個數據定義語言和數據操縱語言的具體實現。這樣,就可以用程序設計語言的形式概念和方法來研究數據模型。

相關焦點

  • 空間數據模型概念和主要類型有哪些
    空間數據模型概念和主要類型:  空間數據模型是關於現實世界中空間實體及其相互間聯繫的描述。空間數據模型的主要類型:基於對象(要素)的模型;網絡模型;場模型。  要素模型:  點對象,由特定位置、維數為零的物體;線對象,維度為一的空間組成部分;多邊形對象,即面狀實體,通常用封閉曲線加內點來表示。矢量模型即是基於要素的,將現象看成原型實體的集合,矢量模型的表達源於空間實體的本身,通常以坐標來定義。
  • 「數據架構」實體關係模型介紹
    在簡單關係資料庫實現中,表的每一行表示實體類型的一個實例,表中的每個欄位表示屬性類型。在關係資料庫中,實體之間的關係是通過將一個實體的主鍵作為指針或「外鍵」存儲在另一個實體的表中來實現的傳統上,ER/數據模型是在兩個或三個抽象級別上構建的。注意,下面的概念-邏輯-物理層次結構用於其他類型的規範,並且與軟體工程的三種模式方法不同。
  • 助你成為模型的設計高手:目標-抽取本質-概念-內涵-定義-模型!
    任何一個模型,都要對複雜的事物進行簡化,從複雜事物之中抽取出屬性,這樣子才能從複雜走向簡單。簡單是為了抓住事物的關鍵特徵,而捨棄掉次要的特徵。抽取關鍵的特徵,捨棄掉次要的特徵,以達到對一類事物的共同抽象。模型是用來處理一類事物,一類事物是一個集合,這類事物裡包含帶著重要特徵的許許多多的具體的事物。模型具有抽象性,通過抽象而達成一定範圍的普遍性。
  • 資料|數據挖掘:概念、模型、方法和算法(第2版)/ 國外計算機科學...
    from=leiphonecolumn_res0602以下書籍介紹來自圖書商城內容簡介 · · · · · ·隨著數據規模和複雜度的持續上升,分析員必須利用更高級的軟體工具來執行間接的、自動的智能化數據分析。
  • 常用數據分析模型及波特五力模型
    導讀:數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,將它們加以匯總和理解並消化,以求最大化地開發數據的功能,發揮數據的作用。數據分析是為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。
  • 理解數據類型:每個數據科學愛好者都應該知道的數據結構
    由於基礎設備不斷進步,現在可以擁有多個數據源,如傳感器、CRMs、事件、文本、圖像、音頻和視頻。現在的大量數據中,大部分是非結構化的,即沒有預定義模型/結構的數據。如圖像,是像素的集合,文本數據是沒有預定義儲存模型的字符序列,以及用戶在Web應用程式上操作的點擊流。
  • 普遍概念模型與具體事物對象
    由此,人們便不會再將精力放在模型本身特性關係的思辨研究上,而會主要著眼於事物概念模型共性抽象可否測量與概念模型相互關係原理的可否經驗證實上。新觀點使人們不再注重概念模型的真假,而注重概念模型表徵對象的命題代入與運用,注重概念模型抽象特性及模型關係結論在現實中的驗證。
  • 一個概念所指的事物就是外延了,對外延分類就是劃分,如何劃分呢
    啥是劃分呢,針對啥劃分呢,當然是對概念的外延進行劃分,首先要弄懂啥是概念的外延,一個概念所指的事物就是概念的外延了,舉兩個例子,一個採取性質屬性來對外延劃分的例子,一個採取關係屬性來對外延劃分的例子。劃分就是對外延進行分類,分成成更小的子類,劃分中容易出現的一些問題,比如遺漏,比如沒有窮盡,比如沒有相互獨立。舉個採取性質屬性來講劃分的例子。劃分有什麼要求,劃分的要求是根據什麼來的呢?
  • 這篇文章把數據講透了(四):數據挖掘
    編輯導讀:隨著「數智化」時代的到來,我們生活中的方方面面都離不開數據,而你真的了解數據嗎?本文將為你重新解讀數據的概念和價值,以及數據的價值是如何在「數智化」時代下一步一步得到運用與升華的;因內容頗多,筆者將分幾期為大家進行講解。
  • 資料庫之概念模型的表示方法,E-R圖的簡單製作法則
    各位小夥伴們,大家好,這次小編要介紹一下概念模型的表達方法,在上面一篇文章中,小編有提到過什麼是概念模型,它是信息模型,是一種面向用戶面向客觀世界的模型,是現實世界到信息世界的一次抽象。小編覺得,要知道概念模型的表示方法,就必須了解信息世界,因為概念模型主要是用來表示信息世界的。
  • 如何用線性回歸模型做數據分析?
    編輯導語:在日常工作中,很多時候都會用到數據分析的方法,線性回歸模型看起來非常簡單,但實際上它的十分重要;本文作者分享了關於如何用線性回歸模型做數據分析的方法,我們一起來學習一下。
  • 通過Python 代碼實現時間序列數據的統計學預測模型
    在本篇中,我們將展式使用 Python 統計學模型進行時間序列數據分析。** 問題描述 **目標:根據兩年以上的每日廣告支出歷史數據,提前預測兩個月的廣告支出金額。數據準備:劃分訓練集和測試集。單變量時間序列統計學模型的關鍵要素如果我們想要對時間序列數據進行上述統計學模型分析,需要進行一系列處理使得:(1)數據均值(2)數據方差 (3)數據自協方差 這三個指標不依賴於時間項。即時間序列數據具有平穩性。
  • 有何數據?
    二、何為族「族」是Revit軟體衍生出的一個概念。熟悉Revit軟體的都知道Revit的模型是由一個個族來構建的,在Revit軟體裡面將族分為了系統族、內建族和可載入族。系統族是Revit的項目樣板中自帶圖元,只能通過修改參數來創建構件類型,如牆體、樓板、管道、風管等。內建族和可載入族可以通過拉伸、選擇、融合、放樣、放樣融合等命令來創建各種各樣的構件,如結構柱、結構梁、門窗、植物、電器、照明設備等構件。
  • 紅旗被刷屏,概念模型展現全新設計語言
    為此,特叔只想告訴大家,多數人沒把概念車和概念模型雕塑分清楚,因為紅旗在現場展現的是概念模型,並非概念車,更不是量產車。概念模型並非概念車,這一點才是關鍵剛才特叔提到了一點:此番在人民大會堂搞出大動靜的紅旗,並沒有發布概念車,發布的是概念模型,那這裡有何不同呢?在中國品牌遍地開花的當前環境下,中規中矩的「官車」形象已經不適合主流審美。
  • 梳理數百個問題後,我總結出10個數據科學面試必掌握概念……
    在梳理了數百個數據科學面試問題之後,本文總結出了10個最常出現的深度學習概念。話不多說,讓我們開始吧!激活函數有幾種類型,但是最流行的激活函數是整流線性單元函數,也稱為ReLU函數。ReLU函數優於S型函數和雙曲正切函數函數,因為它執行梯度下降的速度更快。請注意,在圖像中,當x(或z)很大時,斜率非常小,這會顯著減緩梯度下降,但這種情況不會出現在ReLU函數中。
  • 乾貨,史上最全的葡萄酒類型劃分
    乾貨,史上最全的葡萄酒類型劃分葡萄酒的品種很多,因葡萄的栽培、葡萄酒生產工藝條件的不同,產品風格各不相同。以成品顏色來說,可分為紅葡萄酒、白葡萄酒及桃紅葡萄酒三類。在葡萄酒的世界裡,「甜」與「幹」只是一個相對的概念。甜紅葡萄酒是指由紅葡萄品種釀造的、殘留糖分大於45克/升的葡萄酒。2、白葡萄酒乾白葡萄酒(le vin blanc),「幹」是從香檳酒釀造中借用的一個詞,即不添加任何水、香料、酒精等添加劑,直接用純葡萄汁釀造的酒。
  • 淺談數據挖掘的基本概念及其最常用算法
    淺談數據挖掘的基本概念及其最常用算法 淺談數據挖掘的基本概念及其最常用算法 2020-06-04 13:47:34  來源:今日頭條很多人對大數據的基本概念和特點已經有所了解, 關鍵詞: 數據 挖掘   當前,大數據的理論和應用正在國民經濟和生活的各個領域如火如荼的進行。
  • 利用Python進行數據分析(三):數據預處理與建模分析
    0.前言本系列主要是利用Python進行數據採集、清洗、預處理和利用機器學習算法對數據進行建模分析,幫助建立數據分析的流程,理解機器學習算法的應用方法。由於金融數據是相對而言較為方便獲取的數據,數據類型豐富,此系列以金融數據為例,進行案例分析。
  • 屬性、概念、定義、內涵、外延、劃分、判斷、假設、一次大整合!
    專欄行文到這裡,談的都是對一些最基礎詞語所對應概念的認知。涉及哪些最基礎詞語呢:屬性、本質屬性、概念、定義、內涵、外延、劃分、判斷、假設、線性思維、推理、論證。先後順序性,意味著如果倒過來一下,可能學習就會碰到障礙。在沒搞懂屬性的情況下,去學習概念,就會碰到障礙。
  • 音樂類短視頻APP媒介形象模型的建立和檢驗
    範秀成、陳潔在Aaker模型的基礎之上,提出品牌形象綜合測評模型及相應的指標體系,這一模型將品牌形象分為四個維度:產品維度、企業維度、人性化維度和符號維度,並在每一維度下提出具體的測量指標。該模型更細緻的劃分出具體的測量項,彌補了Aaker模型的空白。