什麼是合成數據?為什麼它需要主數據管理?

2021-01-13 StiboSystems主數據

by Darren Cooper

合成數據(Synthetic data)是使您的業務運營平穩運行的測試數據;如果這些操作通過人工智慧實現自動化,那麼使用主數據管理(MDM)來確保您的決策是無偏見的,這一點非常重要。

數據生成的數據反過來又生成更多的數據。我們如何知道產生的數據是否符合業務需求策略?舉例,如果一個機器人,旨在幫助我們做出明智的投資決策,或者是為我們的客戶服務問題提供最佳答案,但是在處理過程中卻出錯了呢?

顯然,從所有不同角落測試解集都很重要。隨著人工智慧在自動化決策過程中扮演著越來越重要的角色,確保由主數據管理(MDM)支持的機器學習操作(MLOps)從良好的可解釋數據(XAI)和無偏見的數據中工作變得至關重要。

在數據投入使用之前,通常需要將其組織成數據集,以支持不同類型的測試和建模需求,以便了解應用程式、分析模型和基於人工智慧的進程將如何針對這些真實世界/代表性/實驗數據集執行。這就是你需要合成數據的地方。

什麼是合成數據

合成數據是通過算法生成的,以補償真實世界的數據不夠豐富,數量不滿足測試需求的狀態。合成數據大部分來自於生產數據;合成數據通常會忠實於源信息的統計性質,而不是精確的副本。除了具有代表性的真實世界數據外,合成數據還可能包括一些數據集,這些數據集驅動「路徑」來測試特定條件下系統行為的預期,並促進預測分析。

顯然,為了能夠提供有用的結果,合成數據需要與操作型數據具有相同的信任級別。合成數據在被人工智慧應用程式使用時,應該不帶有偏見性。因此,首先必須正確獲取操作型或生產型數據,為合成數據生成提供良好的起點。同樣重要的是確保在生產數據中通常找不到的用例可以被組裝和組織起來。為此,主數據管理可以提供幫助。

什麼是主數據管理(MDM)?

當我們想到主數據時,我們主要想到的是操作型數據:1.用於支持銷售和服務運營的客戶主數據2.採購過程中從供應商處收集的產品主數據3.建模基本運營基礎設施所需的資產主數據

主數據管理(MDM)是提供業務關鍵信息(如客戶數據)的單一、可信視圖的關鍵驅動器。擁有可信賴的數據集成和可操作的應用程式集成可以幫助您降低成本。

使主數據既可信又有洞察力的關鍵在於對它有一個透明的視圖。透明度源於定義數據的含義、目的和治理政策。

主數據管理定義並實施數據治理策略,以保證主數據的質量,例如:1.來源2.準確性3.一致性4.可獲得性5.安全性6.可審計性7.道德性

接受業務監督,並根據業務目標進行衡量。主數據管理(MDM)可以幫助您管理數據集,以確保在生成為合成數據集時,數據集更加可靠和完整。良好的合成數據集提高了數據科學項目的能力,推動預測和機器學習產生更好的結果。

合成數據在零售業中的應用

讓我們想像一下新產品的上市。銷售戰略布局對銷售有什麼影響?哪些客戶群體更有可能購買它?

從數據科學的角度對產品介紹進行測試,需要獲得大量好的、有代表性的數據。這將從包含現有客戶和產品數據開始。這些數據的準確性和可見性是在進行任何分析之前進行測量和修正的關鍵。這是主數據管理(MDM)可以提供幫助的地方。

主數據管理(MDM)支持並確保客戶數據策略的正確實施,包括數據完整性和高質量標準性。零售商不一定需要客戶的360°全方位視圖,而只需要適合特定目的的視圖:創建綜合數據集,以加強對新產品銷售潛力的預測。

如果現實世界中的數據缺乏豐富性和數量來支持生成測試更多角落和決策路徑的數據,主數據管理(MDM)可以通過管理具有更高質量的匿名客戶數據集來提供幫助。

將主數據管理(MDM)中的數據規則與數據科學或機器學習(ML)項目的目標結合起來後,零售商現在能夠為後續的預測分析開發適當的合成數據集。

在幫助消費者做出明智的選擇方面,AI/ML正在成為客戶體驗中無處不在的一部分。例如,如果消費者創建一個已查看產品的集合,那麼ML算法可以查看產品的屬性,根據消費者的行為模式提出推介產品和服務。

人工智慧與機器學習中的合成數據

合成數據管理是人工智慧和機器學習的基本要求。機器學習(ML)模型需要訓練。要做到這一點,他們需要數據。合成數據可以為ML提供所需的數量和用例。主數據管理(MDM)通過為可解釋的AI驗證提供良好的數據支持。

合成數據在金融服務中的應用

金融部門擁有大量的合成數據管理案例。例如,銀行或保險數據可能包含一些非常敏感的個人可識別屬性。但與此同時,金融服務公司需要與商業夥伴和監管機構共享信息。生成合成數據集可以幫助刪除個人信息(也稱為數據屏蔽),同時保留內部複雜數據關係的本質。在訓練一個欺詐算法時,你不需要知道涉及的人的名字。然而,您需要識別一個代表可疑活動的統計模式。

在分析歷史趨勢時,如果要避免過去的錯誤,就需要生成既代表實際事件又代表假設情景的綜合數據集。展望未來時,需要創建能夠反映從當前趨勢到未來趨勢的數據集,這在設想下一個產品或服務時至關重要。

MDM將治理引入到合成數據中,以使結果可以解釋

MDM的使命在於確保原始生產數據集能夠產生具有代表性和有用的合成數據集。在某些情況下,可能需要MDM來掌握這些合成數據集的某些元素,以便對它們進行機器學習。雖然可以使用數據掩蔽和合成數據生成(有很多工具可以做到這一點)等技術來轉換單個屬性,但確保原始源的真實表示的能力可以受益於MDM應用的數據治理策略。

MDM通過實施業務流程來提高合成數據的針對性和可解釋性,以確保原始信息或合成信息的管理具有代表性、連貫性、高質量和洞察力。這反過來將使人工智慧更易於解釋,減少偏見。

相關話題:

主數據管理(MDM),零售業,金融業,數據透明度,合成數據

Darren Cooper的大部分職業生涯都是在軟體銷售諮詢方面度過的,他在多個行業工作。在過去的15年裡,他專攻信息管理,為全球藍籌股公司的數據治理戰略提供諮詢。今天,Darren通過展示我們獨特的技術如何幫助加快客戶的數位化轉型之旅,在幫助Stibo Systems(思迪博)發展業務方面發揮了領導作用。

關於Stibo Systems思迪博

主數據管理公司Stibo Systems(思迪博)是數據透明度理念的卓越推動者。我們的解決方案是世界各地具有前瞻性的公司背後的科技驅動力,這些公司已經釋放了其主數據的戰略價值。我們的解決方案推動他們改善客戶體驗,促進創新和成長,為數位化轉型創造堅實的基礎。這給了他們所需要和期望的商業理解及掌控——擁有對主數據的單一、準確的視圖——這樣他們就可以做出明智的決策,實現更大規模、更廣範圍和更加進取的業務目標。Stibo Systems(思迪博)是Stibo A/S集團的私有控股子公司,成立於1794年,總部位於丹麥奧胡斯。擁有超過40年管理主數據的行業經驗。

相關焦點

  • 備份規則:解決您的數據丟失問題的經驗法則
    他在他的書《大壩之書:攝影師的數字資產管理》(The DAM book: Digital Asset Management for photographer)中創造了這個詞,從那時起,它已經成為一種主流的備份方法,甚至在技術人員中也是如此。這種方法的流行在於它的有效性。甚至連US-CERT都建議使用它來創建備份。
  • 從線下到線上,引爆數據分析新機遇
    如何實現數位化轉型:三大領域應用場景 利用專業的數據分析工具,打造數據中心,實現跨系統數據的集成與整合。通過靈活、多維數據分析,實時、動態了解企業經營業務現狀,提高抗風險能力,將沉澱的數據快速轉化成數據資產,不斷挖掘數據價值,實現市場開拓創新與內部管理優化的雙輪驅動,助力企業推動業務增長,實現持續發展。
  • ESA發布基於哈勃望遠鏡數據的三角座星系壯觀合成圖景
    這副擁有6.65億像素點的巨幅合成圖像(Mosaic)共由54幅圖像合併而成,清晰顯示了三角座星系的中心部分(恆星形成區域)和內部旋臂區域。 三角座星系巨幅合成圖像(Mosaic)為34,372 x 19,345像素,是哈勃數據編制的第二大合成圖,總像素數為6.65億像素,範圍內包括約
  • 數字驅動創新 我愛我家著力推進人力資源管理升級
    今年以來,我愛我家在「數位化轉型」進程中明顯加快了步伐,1月7日,我愛我家與微軟中國籤署《戰略合作備忘錄》,微軟中國將為我愛我家及其關聯公司提供基於客戶關係管理、雲計算、人工智慧、大數據、DevOps等技術的多方面技術支持,同時我愛我家將基於微軟相關技術在房地產經紀領域構建解決方案。1月24日,我愛我家與中國移動達成網際網路及數字傳輸等專線服務和IDC和移動雲服務的戰略合作。
  • 我的世界藥水合成表搭配教程 全部藥水配方合成
    關於全部藥水配方合成也是一個難點。下面就為大家帶來我的世界藥水合成搭配教程。   我的世界藥水合成表:   合成完後拿在手上,跑到水邊對著水按下滑鼠右鍵舀水,讓它變為水瓶——   (這裡以初級治療藥水為例教大家熬製藥水):為了製作初級治療藥水,玩家需要一個閃光西瓜(官方翻譯為閃爍的西瓜)和1瓶笨拙的藥劑(上文已經製作好),閃光西瓜的合成公式:
  • 我的世界藥水合成表大全 我的世界藥水怎麼合成
    我的世界藥水合成表: 眾所周知,首先,玩家需要一個煉藥器(英文原文Brewing stand別慌,準備工序還沒有完成,玩家還得合成玻璃瓶—— 合成完後拿在手上,跑到水邊對著水按下滑鼠右鍵舀水,讓它變為水瓶——
  • 冬天來了,CEO更加關注人效,「六點一刻」推出數據驅動的人力管理...
    CEO做企業管理決策,往往和投資人做投資決策很像。 其實也是在尋找和發掘高回報區域,即在哪些人才身上加大投資從而可以帶來更大回報。但是,離開一個可衡量可預測的人力資本回報率模型來做編制擴張和人才管理,就逐漸會意識到企業效能低下,越多招一個人,虧損越多。這也是為什麼當下一些發展不錯的網際網路獨角獸企業也同樣陷入了裁員縮編的情況。
  • 管理陷阱:管理需要始終如一
    關注【本號】,更多關於企業管理、員工激勵、薪酬制度、績效激勵等內容免費與你分享!私信「績效」送您關於員工管理、績效薪酬的乾貨視頻。管理需要始終如一管理方式不是一成不變的,因此,你要不斷改變自己,適應工作環境的變化。只有那些沒有安全感的人才會墨守成規。
  • 為什麼管理必須要相生相剋?
    很像是我們沒有成年的時候,已經有了自我意識,其實消費者還沒到覺悟期,消費者有時候是不理性的,甚至連他自己要什麼都不知道。這方面老福特早就發現了這個問題,他說:「如果我不高於消費者的話,我永遠不能夠為消費者服務。為什麼?當我問大家要什麼東西的時候?大家一定會說我要一匹更快的馬,不會說要汽車。」企業作為市場的主導者,其實一定是高於消費者的。
  • 嵌入式 BI 行業解決方案:智慧環保大數據可視化系統
    但是由於長期缺乏先進科學的環境監測、監察、監控手段,無法為行政、法律、經濟等環境管理手段,導致環保工作進展緩慢,成效不足。二、環保行業商業智能 BI 核心訴求環保行業從業者期望能夠實現多源環保監測數據匯集融合,優化數據算法,打造生態環境動態資料庫和運營體系,提供智慧環保大數據BI分析服務。
  • 《柳問》:在風口了,我們為什麼還需要柳傳志30年沉澱的管理三要素
    在風口了,為什麼我們還需要柳傳志的管理三要素?因為不管你是大公司小公司,新行業老行業,柳傳志,這位可能是江湖的最後一個「大佬」,你經歷過的,他都經歷過。我們應該肯定 90後願意當好「 U盤」的理念,因為「幹什麼像什麼」的匠人心態是對一個企業員工最基本的要求。但大家都去當「 U盤」並不意味著網際網路時代企業組織的消亡。我相信,兩個 「U盤」想插在一起,還是需要一個組織形式,只要存在組織,就會出現組織中 「U盤」與「U盤」的關係問題、 「U盤」與組織之間的關係問題,這就是組織管理問題,而大型企業組織管理的問題則更加複雜。
  • 《遺蹟:灰燼重生》合成材料怎麼獲取 全合成材料獲取方法
    打敗它後,可以獲得「孢子腺」戰利品。 用途: 用於合成「孢子噴射」戰利品。 打敗它之後會獲得該戰利品。 用途: 用於合成「召喚」效果器。 它的招牌動作是可以無限閃現,並且召喚出各種蝙蝠嘍囉。 打敗它之後,會獲得該戰利品。 用途: 用於合成「閃爍令牌」。
  • 什麼是供應鏈管理?為什麼供應鏈體系非常重要?
    這時候工廠要加工什麼產品,調度運營就需要安排先加工誰的,後加工誰的,既不要讓有些產線閒著,也不要讓有些產線堵塞。通過統籌,保證工廠加工出來的產品能實現價值最大化。2.控制度關鍵點:保齊套和平衡產能對於欠料和齊套管理,給大家推薦五種方式:一是生產調度例會管理機制,採用例會的方式做終端;二是物料基礎數據的監控與管理;三是IT工具的運用管理(ERP—企業資源計劃、APS—自動採購系統及其它輔助工具);四是庫存報警機制的建設(RYG管理、預缺料管理);五是有效跟單與追料。平衡產能的方法比較原始,有五種。
  • 雲頂之弈S3賽季新裝備合成公式一覽 S3裝備合成路徑
    聖杯這件新的裝備需要你的隊伍將它圍起來才能發揮最大效果,但是如果你願意這麼幹的話,它可能會非常的強。舉個例子,把它裝備給隊伍中施放技能很早的英雄會為你全隊提供大量的法力值,加快他們技能施放的速度來為你建立優勢。如果你玩過初始賽季的話,有點像崔斯特的藍牌!
  • 《萊莎的鍊金工房》引誘火瓶屬性介紹 合成素材是什麼
    導 讀 萊莎的鍊金工房裡引誘火瓶是一種物品,很多玩家都不太清楚裡引誘火瓶合成需要的素材是什麼,今天小編就給大家帶來裡引誘火瓶合成素材是什麼的介紹,一起來看看吧
  • 「重大出生缺陷大數據云平臺總體建設與數據資源管理應用項目」軟...
    「重大出生缺陷大數據云平臺總體建設與數據資源管理應用項目」軟硬體採購招標公告 公告信息: 採購項目名稱 「重大出生缺陷大數據云平臺總體建設與數據資源管理應用項目」軟硬體採購 品目 貨物/通用設備/計算機設備及軟體/計算機設備/伺服器
  • 小象飛羊創始人CEO楊洋:精細化的數據管理 帶來更多行業機會
    在此背景下,由金融界主辦的第五屆智能金融國際論壇暨2020金融界領航年度盛典於12月10日在京召開,百位金融業大咖齊聚一堂,就金融行業的數位化轉型發展、金融科技在財富管理領域的應用、公募基金大時代、養老金融的未來等話題進行深入務實的探討交流。  小象飛羊創始人CEO楊洋在證券平行論壇討論時表示,精細化的數據管理,帶來更多行業機會。
  • 專訪|「生命密碼」編寫者戴俊彪:合成基因中國何以效率最高
    該基因不僅僅有著特異的表達調控方式,而且在不同的細胞中它可能重複150次,也可能重複100次。為什麼會這樣?是什麼決定的?提起12號染色體有多特殊,戴俊彪的語速快了些。好奇心是科學家探索未知最大的牽引,戴俊彪攬下了第12號染色體的合成任務。
  • 我的世界:10個玩家自製的奇怪合成表,上吊的苦力怕是認真的嗎?
    三、鑽石末影甲在MC裡,末影珍珠的傳送效果實用性很強,但是每次使用它都需要玩家手持末影珍珠,在一些戰鬥情況下很不方便,玩家於是構想了一個關於鎧甲的合成—鑽石末影甲,在原有的鑽石甲合成配方裡加入末影珍珠,於是鑽石盔甲就有了末影珍珠的能力,穿鑽石末影甲,追著末影人打!