管理者在數據分析上常犯的9個錯誤

2020-12-17 36氪

數據是人類的發明。人類定義了他們想要測量的現象,設計系統收集數據,在分析之前進行清理和預處理,最後選擇如何解釋結果。即使使用相同的數據集,兩個人也可以得出截然不同的結論。這是因為數據本身並不是「地面真實」——能夠反應客觀現實的、可觀察的、可證明的數據。

你如何概念化一個現象,確定要測量什麼,並決定如何測量,將影響你收集的數據。你利用AI解決問題的能力很大程度上取決於你如何表述你的問題,以及你是否能建立無歧義的」地面真實「。如果你的標準本身是錯誤的,那麼結果不僅是錯誤的,而且可能對你的業務有害。

除非你直接參與定義和監視原始的數據收集目標、工具和策略,否則你可能無法掌握那些能幫你發現錯誤處理、解釋和使用這些數據的關鍵知識。大多數被我們成為「數據」的東西可能是些僅僅是用來支持某種議程的測量、與事實無關的信息集合、或者來自看起來合理、但是帶有偏見的收集工作。

下面是一個關於九個常見統計錯誤的速成班,每個管理者都應該熟悉:

不明確的目標:未能確定收集數據的原因,意味著你將錯過闡明假設和確定收集內容的機會。結果是你可能會收集錯誤的數據或不完整的數據。大數據的一個共同趨勢是企業收集大量信息而不了解他們為什麼需要它,以及他們如何使用它。收集龐大而混亂的數據量只會阻礙你未來的分析,因為你將不得不通過更多的垃圾來尋找你真正想要的東西。定義錯誤:假設你想知道你的客戶上個季度花了多少錢在你的服務上。即使是這樣一個簡單的目標也需要在你得到你想要的信息之前定義一些假設。 首先,你如何定義「顧客」?取決於你的目標,你可能不想把每個人都放到一個桶裡。您可能希望通過購買行為細分客戶,以便相應地調整營銷動作或產品特性。如果是這樣的話,那麼你需要確保你包含了關於客戶的有用信息,例如人口信息或支出歷史。還有一些戰術上的考慮,比如你如何定義宿舍。你會使用財政季度或日曆季度嗎?許多組織的財政年度與日曆年不符。財政年度也在國際上有所不同,澳大利亞的財政年度從7月1日開始,印度的財政年度從4月1日開始。你還需要制定一個策略來解釋回報或交換。如果顧客在第一季度買了你的產品,但又把它退回去了呢?如果他們對你提出了質量投訴並得到退款怎麼辦?你把這個事件歸到哪個季度?所以定義不是那麼簡單。你將需要討論你的期望,並設置適當的參數,以收集你真正想要的信息。捕獲錯誤:一旦確定了希望收集的數據類型,就需要設計一種機制來捕獲它。這裡的錯誤可能導致捕獲不正確的或偶然的、有偏見的數據。例如,如果你想測試產品A是否比B產品更吸引人,但你總是在你的網站上顯示產品A,那麼用戶可能不會頻繁地看到或購買B產品,從而導致你得出錯誤的結論。 測量誤差:當你捕獲數據的軟體或硬體出錯時,或無法捕獲可用數據或產生虛假數據時,就會出現測量錯誤。例如,使用日誌與伺服器不同步,則可能丟失行動應用程式上的用戶行為信息。同樣,如果你使用像麥克風這樣的硬體傳感器,你的錄音可能會捕捉到背景噪音或其他電信號的幹擾。加工誤差:許多企業擁有幾十年前的數據,原來能夠解釋數據決策的團隊早已不在了。他們的許多假設和問題很可能沒有文檔化,這將取決於你推斷,這可能是一項艱巨的任務。你的團隊可能會做出與原始數據收集過程中不同的假設,並得出截然不同的結果。常見的錯誤包括缺少一個特定的過濾器,使用不同的會計標準,並簡單地犯方法錯誤。 覆蓋誤差:覆蓋誤差指,目標受訪者都沒有足夠的機會參與數據調查的情況。例如,如果你正在收集老年人的數據,但只提供網站調查,那麼你可能會錯過許多答卷人。你的營銷團隊可能有興趣預測所有移動智慧型手機用戶的行為與未來的產品的關係。然而,如果您只提供iOS應用程式而不是Android應用程式,iOS用戶數據將使你對Android用戶的行為有有限的了解。 抽樣誤差:當你分析一個較小的樣本時,就會發生抽樣誤差。當數據只存在於某個群體中時,這是不可避免的。結論:你得出的代表性樣本可能不適用於整體。 推理錯誤:當統計和機器學習模型從已有數據中做出不準確的判斷後,它們之後的推理結果也可能是錯誤的。如果你有一個非常乾淨的「地面真實」資料庫,那麼就可以用它去檢測數據模型得出的推理是否正確,但實際上,大多數資料庫是充滿噪音的,所以你通常很難確定AI推論的錯誤點在哪裡。未知錯誤:現實是難以捉摸的,你不能總是輕易地建立事實。在許多情況下,比如使用數字產品,你可以捕獲大量用戶在平臺上的行為數據,而不是他們對這些行為的動機。你可能知道一個用戶點擊了一個廣告,但你不知道他們對它有多惱火。除了已知的許多類型的錯誤之外,還有一些未知,它們在以數據代表的現實和現實本身之間留下了一個缺口。沒有數據科學或機器學習背景的管理人員通常會犯這九大錯誤,但許多更微妙的問題也會阻礙AI系統的性能。

原文來自:9 common mistakes executives make with data

相關焦點

  • 管理者常犯的職務錯誤有哪些?
    如何避免在管理時犯以下6種錯誤:範圍太小、虛假的職務、管理與工作失衡、職務設計不合理、把頭銜當獎賞、寡婦製造者? 1 範圍太小 最常見的錯誤是把職務設計得太小,以至於一個優秀的管理者得不到發展。
  • 數據分析中常犯的18個統計學錯誤,請務必跳過這些坑
    在數據分析的過程中我們經常會用到很多的統計學知識,但有很多統計學知識經常有人用錯,從而導致分析結果不盡如人意,今天就給大家列舉了18個容易錯的統計學知識點,建議大家收藏留著以後慢慢看:1. 變量之間關係可以分為兩類:函數關係:反映了事物之間某種確定性關係。
  • 10個常犯的期刊投稿合規性錯誤
    這篇文章中,我們將分享十種作者常犯的導致拒稿的期刊合規性錯誤:1.未能遵守期刊指南:這種情況主要是是因為作者在起草稿件時沒有檢查期刊指南,因此也就沒有遵守相應的期刊要求。2.數據不一致:稿件中的數據中有不一致之處,或者是數據的無意義重複。比較常見的是文章正文的數字與表格/圖表中的數字不匹配。
  • 數據科學家新手常犯的 13 個錯誤(附工具、學習資源)
    如今越來越多的企業正在變得以數據驅動,世界變得越來越緊密,以致於看起來每個企業都需要數據科學實踐。因此,對數據科學家的需求是巨大的。甚至更好的是,業界數據科學人才短缺已經成為共識。 然而,要成為一名數據科學家並不容易。需要掌握多種技能,才能真正成為一名數據科學家。這些技能包括解決問題、結構化思考、編程和其他專業技能。
  • 《企業經營數據分析》給傳統企業管理者的數據分析指南
    我怎樣才能把數據變成對公司和工作有用的價值,從哪裡入手?」這些問題很基礎,同時也非常重要。萬丈高樓平地起,傳統企業想要建起自己的數據體系搭上智能快車,必須要從地基開始,否則就真應了那句話了——基礎不牢,地動山搖。
  • 避坑指南:數據科學家新手常犯的13個錯誤(附工具、學習資源連結)
    如果你不是技術出身或者數學出身,就很有可能通過書籍和視頻課程來學習,但大多數並沒有教你那些當前業界渴望從數據科學家身上尋找到的東西。 這是想要成為數據科學家的人正在努力彌合自我教育與現實世界工作之間的差距的原因之一。 在本文中,我會討論數據科學家新手常犯的錯誤(我自己也犯了其中一些),並提供了相關資源,旨在幫助你避免數據科學之旅中的這些陷阱。
  • 提醒 | 生產線上的這些錯誤,千萬不能犯!
    人為的錯誤不僅存在,無法完全避免,另外,人為錯誤還會影響機、料、法、環、測等因素(畢竟事情都是人做的,沒法完全獨立),比如加錯料了。所以「防錯」這個概念就應運而生了,其誕生的很大一部分意義就是與人(為錯誤)做鬥爭(我們一般不去談設備、物料犯錯誤)。有人總結了錯誤發生的十大原因,這裡分享給大家。
  • 警惕:研究中最常犯的10大統計學錯誤
    2020年6月,PM&R雜誌發表了題為「Ten Common Statistical Errors from All Phases of Research, and Their Fixes」的文章,作者列舉了研究四個階段(研究設計→數據整理與清洗→數據分析→結果報告)常犯的10個統計學錯誤案例,並給出了可以幫助研究人員避免這些錯誤的潛在解決方案
  • 公務員考試考生常犯錯誤以及命題陷阱分析:邏輯填空
    考生常犯錯誤以及命題陷阱分析--邏輯填空  邏輯填空在言語理解與表達佔了一半的比例,而從學生的做題情況和考題的發展規律來看,其難度往往比片段閱讀更大,考生失分更多。那邏輯填空失分的原因在哪裡呢?
  • 高速上經常犯的3個錯誤,尤其是第2個,10個司機9個有!
    高速上經常犯的3個錯誤,尤其是第2個,10個司機9個有!「家有家法,國有國規」,不僅家裡有規矩,國家有規矩,而且上學、上班也有著一定的規矩。說白一點就是在上學的這段期間,他們是不會與汽車接觸的,所以當他們買車之後,開車會有些許陌生,開車總是犯一些錯誤,尤其是高速上,一不小心會造成傷害,所以今天小編就給大家講解一下高速上常犯的3個錯誤,一定要格外注意這幾個方面。1.實習期亂上高速。交規有明確的規定,實習司機不可單獨一個人上高速。如果真的要上高速,必須要有3年以上行車經驗豐富的司機陪同。
  • 上廁所常犯的 4 個錯誤,看完了你肯定會改
    上廁所常犯的 4 個錯誤,看完了你肯定會改 2020-03-02 15:07 來源:澎湃新聞·澎湃號·政務
  • Influencer Marketing最常犯的六個錯誤
    以下為大家介紹Influencer Marketing最常犯的六個錯誤。由於YouTube的用戶數量相當龐大,因此透過大數據資料的分析方式,可以分析用戶的使用行為與習慣,找到品質良好且產值相對高的YouTuber,而以下幾點是你找YouTuber時應該先想想的問題:
  • Oracle認證:PHP開發者常犯的MySQL錯誤
    【IT168技術】為了方便廣大考生更好的複習,綜合整理提供了Oracle認證:PHP開發者常犯的MySQL錯誤,以供各位考生考試複習參考,希望對考生複習有所幫助。  PHP開發者常犯的10個MySQL錯誤  資料庫是WEB大多數應用開發的基礎。
  • 2016香港自助遊攻略:遊客五個常犯錯誤遊法
    2016香港自助遊攻略:遊客五個常犯錯誤遊法  很多人去香港旅遊,很多人去香港購物,很多人回來寫遊記,但是很多錯誤,仍然有很多人繼續不斷的犯著。比如遊香港山頂、星光大道、購物時間上的把握是非常重要的。以下分享五個遊客常犯的錯誤遊法,供參考!  一、上山頂從中環出發?錯!
  • 寫作中常犯的24種邏輯錯誤
    小紅犯了錯誤歸因的謬誤。3訴諸感情你試圖通過操作別人的感情來取代一個有力的論述。你操作的感情可能包括恐懼、嫉妒、憐憫、驕傲等等。一個邏輯嚴謹的論述可能激起別人的情感波動,但是如果只用感情操作而不用邏輯論述,那你就犯了訴諸感情的錯誤。
  • 盤點人們最常犯的10個英語語法錯誤
    即使是很聰明的人也會在寫作時犯一些愚笨的錯誤。有時是因為犯懶或沒耐心,有時是他們真的很困惑。根據來自百萬用戶的數據,微軟公司最近整理出了英語中最常見的語法錯誤前十名。在下面,我們列出了來自微軟的10個最常見語法錯誤及示例,你大概至少會犯其中的一項錯誤。   1.
  • 餘世維成功經理人講座:經理人常犯的11個錯誤
    ——傑克·韋爾奇1、經理人常犯的11個錯誤1.1、拒絕承擔個人的責任不要常常講:我以為。生活中有兩種人:杜魯門總統的門上的字:麻煩到此為止。觀察你自己,別光是觀察市場/管區/辦公室。有效的管理者,會為事情的結果,負起責任。
  • sci論文寫作中常犯的6個語言錯誤
    一篇sci論文可能只要解決了語言上的不足,就可以被錄用見刊,足見英語語言對我國作者發表sci論文帶來的不利影響。關於sci論文寫作中常犯的6個語言錯誤,闡述如下。sci論文寫作中常犯的6個語言錯誤1、存在簡單的漢英互譯現象我國科研工作者或畢業生發表sci論文,通常都是先寫中文,再翻譯成英文。
  • 商務英語寫作中常犯的5個錯誤(圖)
    新東方網>英語>英語學習>英語寫作>商務寫作>正文商務英語寫作中常犯的5個錯誤(圖) 2012-09-01 13:41 來源:《kugroo》的博客 作者:
  • 考研數學中常犯的五種錯誤及重難點分析
    考試中學生常犯的五種錯誤結合往屆考研同學在考試中出現的問題,跨考考研輔導專家大致總結出同學們在平時複習及考試中可能存在的五個問題:1、概念不清。概念幾乎是一切數學解題的基礎,有同學在平時複習中只注重概念的死記硬背,卻忽略了對概念的理解。另外,數學概念眾多,久而久之就會出現概念混亂,概念一旦出錯,解題就會出現問題。