前言 元數據管理是從數據資產中獲取所有可能價值的關鍵。然而,大多數組織並沒有使用他們所掌握的所有數據來得出關於如何增加收入、實現法規遵從性或完成戰略目標的更深層次的決策和分析。
Gartner公司將元數據定義為「描述數據資產各個方面的信息,以便在整個生命周期中提高其可用性。」將數據轉變為資產的是元數據。」
簡單的說,元數據就是關於數據的數據。每次從數據源採集數據、用戶訪問數據、在組織中移動數據、與來自其他數據源的其他數據集成或增強數據、分析、清理和分析數據時,都會生成它。
它之所以有價值,是因為它提供了有關數據元素屬性的信息,這些屬性可用於指導戰略和運營決策。元數據管理是對描述其他數據的數據的管理,重點是關聯和沿襲。它涉及建立策略和流程,以確保數據可以在整個組織中集成、訪問、共享、連結、分析和維護。
強大的數據管理策略和支持技術及業務所需的數據質量,包括數據目錄(各種來源的數據集)、數據映射、版本控制、業務規則和詞彙表維護以及元數據管理(關聯和沿沿性)。
元數據可以回答的重要問題:
我們有什麼數據?
它是從哪裡來的?
它現在在哪裡?
自最初創建或採集以來,它發生了什麼變化?
誰被授權使用它,如何使用?
它是否敏感或有任何相關的風險?
元數據還可以幫助組織:
發現數據。從各種數據管理豎井中識別和查詢元數據。
採集數據。自動採集來自不同數據管理筒倉的元數據,並將其合併到單個源中。
構造和部署數據源。將物理元數據連接到特定的數據模型、業務術語、定義和可重用設計標準。
分析元數據。了解數據與業務的關係以及數據具有哪些屬性。
地圖數據。確定集成數據的位置,並跟蹤數據如何移動和轉換。
管理數據。開發一個治理模型來管理標準、策略和最佳實踐,並將它們與物理資產相關聯。
數據社會化。利益相關者可以在他們的角色環境中查看數據。
1. 更好的數據質量。有了自動化,數據質量得到了系統的保證,數據管道被無縫地治理和操作,使所有涉眾受益。實時識別集成數據源或目標內的數據問題和不一致性,通過增加洞察或修復的時間來提高整體數據質量。在企業兼併重組過程中,為現有結構的定期維護映射、移動和測試數據,從歷史系統移動到新系統,都更加容易。
2. 更快的項目交付。自動化的企業元數據管理為數據移動和部署項目提供了更高的準確性和高達70%的項目交付速度。它從各種數據源獲取元數據,並將任何數據元素從源映射到目標,並協調跨平臺的數據集成。有了這幅準確的元數據地圖,您可以加速大數據部署、數據倉庫、雲遷移等。
3.更快的洞察速度。像數據科學家花費高達80%的時間來尋找和理解源數據,並解決錯誤或不一致,而不是分析它的真正價值。通過更強大的數據操作和分析,我們可以逆轉這一等式,從而更快地獲得洞見,訪問、連接底層元數據及其沿襲。技術資源可以自由地集中在價值最高的項目上,而業務分析師、數據架構師、ETL開發人員、測試人員和項目經理可以更容易地協作以更快地做出決策。
4. 提高生產率和降低成本。能夠依賴自動化和可重複的元數據管理流程可以提高生產率。例如,一個客戶已經經歷了生產率的急劇提高——超過85%——因為手工密集型和複雜的編碼工作已經自動化,70%以上是因為無縫訪問和所有元數據的可見性,包括端到端血統。顯著的數據設計和轉換節約(分別高達50%和70%)也可能降低高達80%的數據映射成本。
5. 法規遵從性。例如《通用數據保護條例》(GDPR)、《健康保險和便攜性責任法》(HIPAA)、巴塞爾銀行監管委員會(BCBS)和加州消費者隱私法(CCPA)等法規特別影響金融、零售、醫療保健和製藥、生命科學等行業。當關鍵數據沒有作為集成過程的一部分被發現、收集、編目、定義和標準化時,審計可能是有缺陷的。敏感數據被自動標記,它的沿沿性被自動記錄,它的流轉被描述,因此它很容易被發現,它在工作流中的使用也很容易被跟蹤。
6. 數位化轉型。知道什麼數據的存在和它的價值潛力促進數位化轉型1)改善數字體驗,因為你了解組織與如何支持客戶,2)加強數字業務,因為數據準備和分析項目建設得更快,3)驅動數字創新,因為數據可以用來提供新的產品和服務,4)建立數字生態系統,因為組織需要建立平臺和夥伴關係來擴大規模和發展。
7. 企業數據治理。數據治理包括協作關係中的IT用戶和業務用戶,因此數據治理是每個人的業務。現代的、戰略性的數據治理必須是一個持續不斷的進程,它要求從高管到員工的每個人重新思考他們的數據職責,並承擔新的合作和責任水平。隨著業務數據部門推動數據治理和戰略企業目標之間的一致性,以及IT處理數據管理的技術機制,查找、信任和使用數據以有效地滿足任何組織目標的大門打開了。
如果採用手動方式管理元數據管理勢必代價高、耗時長、容易出錯,而且無法跟上動態企業數據管理基礎設施的步伐。儘管集成和自動化數據管理和數據治理對許多組織來說仍然是一個新概念,但它的優勢是顯而易見的。
元數據管理系統需要包括數據目錄、數據讀寫和自動化功能,以更好地了解和訪問數據資產,指導它們的使用,並確保遵循數據策略和最佳實踐。元數據管理的自動化為組織提供對不同數據流的可見性和控制,從收集到聚合和集成,包括具有完整上下遊血緣和所有相關文檔的轉換。
(歡迎大家加入知識星球獲取更多資訊。)
我們的使命:普及數據管理知識、發展數據管理工程師行業、改變中國企業數據管理現狀、提高企業數據資產管理能力、推動企業走進大數據時代。
我們的願景:凝聚行業力量、打造數據工程師全鏈條平臺,培養不同層級數據工程師人才、構建數據工程師生態圈。
我們的價值觀:分享數據管理知識,持續提升數據管理和運營能力。
了解更多精彩內容
長按,識別二維碼,關注我們吧!
數據工程師
微信號:sjgcs
構建數據工程師生態圈