大數據時代的基本常識-數據的概念和數據的類型

2020-12-14 Hotodo導學

生在大數據時代,我們每個人都是數據的貢獻者也是數據的使用者,甚至有人說我們每個人都是活著的數據。這其實一點也不誇張,信不信你每天都在貢獻和使用數據?我們先搞清楚數據是什麼,你就明白了。

在大數據時代以前,數據這個詞,聽起來挺專業,似乎是IT專業人士才能懂,而現在,我們每個人都經常在與數據打交道,如果還不了解什麼是數據,那就有些不符合時代潮流了。

數據的定義以及與信息的關係

數據就是對客觀事件進行記錄並可以鑑別的符號,是對客觀事物的性質、狀態以及相互關係等進行記載的物理符號或這些物理符號的組合。數據是用於表示客觀事物的未經加工的原始素材。這些表示客觀事物的原始素材,有些是連續的值,比如聲音、圖像,我們稱為模擬數據;有些是離散的值,如符號、文字,我們稱為數字數據。在計算機系統中,數據以二進位信息單元0和1的形式表示,所有能輸入到計算機並被電腦程式處理的符號、數字、字母、模擬量等都叫數據。

與數據經常一起說起的,還有信息,甚至日常交流中,很多人都將數據和信息混為一談。這是因為信息與數據聯繫緊密,但又有區別。數據是信息的表現形式和載體,可以是符號、文字、數字、語音、圖像、視頻等,正所謂上面說到的,數據是未經加工的原始素材。而信息是對數據作具有含義的解釋,信息源於數據,但高於數據。數據和信息是不可分離的,信息依賴數據來表達,數據需要用信息表達出來才能被理解。數據是符號,是物理性的,信息是對數據進行加工處理之後所得到的並對決策產生影響的數據,是具有人為約定的邏輯性和觀念性的;數據是信息的表現形式,信息是數據有意義的表示。數據是信息的表達、載體,信息是數據的內涵,是形與質的關係。數據本身沒有意義,數據只有對實體行為產生影響時才成為信息。

數據的類型

上面的數據概念還是有些偏學術,我們可以把數據理解更具體一些。也就是說我們日常工作、生活、學習以及娛樂過程中形成的文字、字母、數字符號的組合、圖形、圖像、視頻、音頻等,以及對各種事物的屬性、數量、位置及其相互關係的抽象表示,都是數據。總的來說,常用的數據可以分為文本、圖片、音頻和視頻四類。

其實我們每天都在貢獻和利用數據

我們工作、學習過程中記錄的文字、形成的文本文件、電子文檔,包括word文檔、wps文檔、txt文本、PPT演示稿、excel電子表格、日誌文檔,這些屬於文本或多媒體數據。我們用手機、相機拍攝的照片、掃描的照片,這些屬於圖片數據。我們電話、說話的錄音、各種聲音的記錄屬於音頻數據。我們用手機、攝像機、監控攝像頭拍攝的影像屬於視頻數據。現如今,隨著信息技術的發展,我們在各大短視頻平臺、各大媒體平臺看到的很多都是融合了文本、圖片、音頻、視頻的多媒體數據。

有人說,我在家休息,什麼都沒幹,也會貢獻和利用數據嗎?那你每天用手機、家電嗎?購物嗎?帶手環、手錶嗎?說話嗎?會出現在或不出現在有攝像頭的地方嗎?我們生活在現代社會,離不開現代化的設備設施,而這些設備設施隨時都可能記錄著你的數據,比如手機的開機關機、各種設備的使用行為日誌,手環、手錶記錄你的睡眠狀況,各地的攝像頭記錄你的出行狀況,所以說我們生活在大數據時代,不是在貢獻數據就是在利用數據。活在大數據時代,不貢獻數據,也不利用數據,很可能格格不入,甚至寸步難行,2020年新冠肺炎傳染病疫情能夠得到有效控制,就是我們每個人都在貢獻數據也在利用數據的實例,我們在提交自己的健康狀況,同時也在獲取各地其他人的疫情情況,貢獻並利用好數據,才能戰勝疫情、生活得更好。

數據是「未來的石油」

石油在當今社會的重要性大家肯定都清楚,現如今是誰控制了石油,誰就控制了全世界。隨著科技的發展,人類最終將走向智能時代,智能時代靠什麼驅動,是數據,而不是石油。所以很多國家都把大數據研發和大數據產業提升到國家戰略,各企業和科研機構也都不斷加大對大數據的研發和應用力度。

看到此,你已經明白什麼是數據,以及為什麼說我們每個人每天都在貢獻和利用數據了吧。關注「Hotodo導學」,帶您學習通俗的大數據、物聯網、人工智慧和IT常識。每天進步一點點,隨時準備著逆襲哦!

相關焦點

  • 大數據開發基礎:Java基礎數據類型
    在Java基礎入門學習階段,Java基礎數據類型無疑是基礎當中的重點,掌握基礎數據類型,對於後續去理解和掌握更深入的理論,是有緊密的關聯性的。今天的大數據開發基礎學習,我們就來講講,Java八種基礎數據類型。
  • 第四篇:JavaScript基本數據類型
    JavaScript基本數據類型有String(字符串類型)、Number(數字類型)、Boolean(布爾類型)、Array(數組類型)、Date(日期類型)。不同於Java語言,JS 語言是弱數據類型,聲明變量時不需要說明數據類型,JS解釋器會自動根據變量的值賦予變量對應的數據類型。
  • 大數據及大數據的4V特徵
    人類歷史上從未有哪個時代和今天一樣產生如此海量的數據。數據的產生已經完全不受時間、地點的限制,數據的總量在不斷地增加,增加的速度也在不斷地加快。而要掌握大數據的概念,首要任務就是從動態上了解大數據的成因。大數據的成因,不僅是人類信息技術的進步,而且是信息技術領域不同時期多個進步交互作用的結果。
  • 教育數據倫理:大數據時代教育的新挑戰
    教育是特殊的社會子系統,事關人的發展、國家和民族的未來,在技術快速演進、法律法規相對滯後的當下,儘快開展教育數據倫理的系統研究,防範可能的風險,為教育的健康發展設置「看門人」,對大數據時代的教育尤顯急迫而重要。
  • 大數據時代,如何培養數據分析思維?
    大數據時代來臨,「數據」熱度飆升,衍生出的行業也受到追捧。據悉,中國大數據行業人才需求2020年將達210萬,未來5年需求量在2000萬人左右。可見,國內數據分析崗錢途與前景並存,想入門該朝陽產業,需要先明白數據分析究竟是什麼?
  • 西門子S7-1200 PLC的基本數據類型,你了解多少?
    ,還支持一些複雜的數據類型,包括結構數據類型Struct、PLC數據類型UDT、數組Array、系統數據類型SDT、硬體數據類型DB_ANY、參數數據類型Variant、String和Char數據類型、WString和WChar數據類型、DTL數據類型等。
  • 大數據時代的到來(下)
    大數據的概念最初是指那些需要處理但信息量過大,超出一般計算機在運行時使用的內存量,因而工程師們需改進處理數據的工具。而大數據時代正是在信息數據的爆炸性擴張和技術進步對信息處理提出更高要求的背景下應運而生的。
  • 大數據關鍵技術淺談之大數據採集
    在前幾篇文章中,企通查為大家介紹了大數據處理的基本流程。從大數據的一系列處理過程中(抽取、集成、分析、解釋),我們可以發現這一整套流程中涵蓋了數據存儲、處理、應用等多方面的技術。 大數據價值的完美體現需要多種技術的協同。
  • 數據湖,比「數據中臺」更需要重視的概念-虎嗅網
    10年前,Pentaho公司的CTO詹姆斯·迪克森在他的博客中第一次提出「數據湖」的概念;10年後的今天,在業界「數據中臺」大火的時代背景下,再來討論「數據湖」,應該別有一番韻味。本文將會以「數據湖」為中心,展開討論數據倉庫、數據湖和數據中臺這幾個概念之間的藕斷絲連。
  • 面試官:Java 中有幾種基本數據類型是什麼?
    認識基本數據類型在學習基本數據類型之前,我們先認識一下這兩個單詞:1、bit --位:位是計算機中存儲數據的最小單位,指二進位數中的一個位數,其值為「0」或「1」。(ref)這種數據類型代表一個比特的信息,但它的「大小」沒有明確的定義輸出Java 支持的數據類型包括基本數據類型和引用類型基本數據類型如下:
  • 網際網路時代,安全生產大數據的分析和應用!
    大數據是指數據量龐大、結構複雜、類型多樣的數據所構成的數據集合,傳統的數據、分析方式已經無法滿足各方面的需求,大數據時代之下,數據集合須通過特定的工具進行存儲、分析和處理,才能形成有規律可循、可預測的數據信息。隨著大數據時代的來臨,各行各業紛紛通過對生產經營活動之中海量的、無序的數據進行分析處理,從而形成有規律,便於展示的數據。
  • 什麼是大數據,權威專家談大數據的4V1C特質
    大數據是當前較為火爆的一個詞彙,究竟什麼是大數據、大數據的概念是怎樣的?大數據有哪些特質,大數據有哪些技術方面的要求,大數據對當前社會產生了哪些重要的影響?國內知名大數據專家、中科院計算所博士、職品匯創始人龔才春博士對此做了詳盡的分析,他指出:「從常規定義來講,大數據就是大小超出常規資料庫工具獲取、存儲、管理和分析能力的資料庫,並且也強調,不是說一定要超過特定TB的數據集才是大數據。這個定義並沒有詮釋什麼是常規的資料庫工具,也沒有詮釋大數據與數據量的關係,是一個比較原始的大數據定義。」
  • 理解資料庫與數據模型的概念
    通過本篇的學習,讀者應該能掌握以下內容:● 編程微課的主要功能● 資料庫的基本原理及數據模型● 關係資料庫1、編程微課編程微課項目使用圖文,語言,視頻等方式進行內容教學,再附加各種訓練題,幫助練習和鞏固知識。微課內容來自於編程達人,編程達人撰寫課程內容,通過編程微課平臺為編程愛好者提供課程內容,獲得收益。
  • 大數據資本主義時代的馬克思
    越來越多的數字算法和數字機器正在不斷生成、收集、存儲、處理和評估大數據,並作出使人在經濟、政治和日常生活中被邊緣化的決策。這一發展導致了具有特定屬性的數字資本主義的出現:大數據資本主義。大數據資本主義需要我們評估思想體系、知識形式、政治經濟、治理術、基礎設施、實踐、組織、機構、主體、空間[2]、時間、話語和意識形態的變化。下文將探討馬克思的理論對理解和批判大數據資本主義政治經濟的重要性。
  • C語言的數據類型簡述
    C語言數據類型分類C語言數據類型分類C語言的數據分類:1.基本類型:整型類型包含:基本整型(int)、短整型(short int)、長整型(long int)、雙長整型(long long int)、字符型(char)和布爾型(bool)。註:整型數據可在類型符號前面加修飾符:signed(有符號整數類型)和unsigned(無符號整數類型),若不指定則默認為「有符號類型」。
  • 數據產品必備技術知識(1):數據倉庫之基本架構及ETL
    前言:元旦這兩天梳理了下之前數據倉庫的知識,發現對於理清自己的思路很有幫助。雖然是技術的範疇,但多了解這些對了解技術架構和產品基礎還是很有好處的。尤其到了新公司之後,對技術理解要求更高,Hadoop,Spark等一系列新興技術的原理和區別也需要有些初步概念。故整理出來和大家分享。
  • ISC 2020大數據安全論壇:新基建時代下的數據安全
    論壇上,阿里巴巴集團安全總監洪澄、中國科學院信息工程研究所研究員鄧燚、上海交通大學教授鬱昱、長亭科技聯合創始人楊坤、區塊鏈安全負責人於曉航等產學研多領域的資深專家齊聚雲端,圍繞新基建時代下大數據安全各自展開了深入淺出的論述。
  • 關於數據倉庫的數據模型的思考
    但是數據倉庫不同於日常的信息系統開發 , 除了遵循其他系統開發的需求 , 分析 , 設計 , 測試等通常的軟體聲明周期之外 ; 他還涉及到企業信息數據的集成 , 大容量 數據的階段處理和分層存儲 , 數據倉庫的模式選擇等等 , 因此數據倉庫的物理模型異常重要 , 這也是關係到數據倉庫項目成敗的關鍵 .
  • 數據湖 VS 數據倉庫之爭?阿里提出大數據架構新概念:湖倉一體
    隨著近幾年數據湖概念的興起,業界對於數據倉庫和數據湖的對比甚至爭論就一直不斷。有人說數據湖是下一代大數據平臺,各大雲廠商也在紛紛的提出自己的數據湖解決方案,一些雲數倉產品也增加了和數據湖聯動的特性。但是數據倉庫和數據湖的區別到底是什麼,是技術路線之爭?是數據管理方式之爭?
  • 理解數據類型:每個數據科學愛好者都應該知道的數據結構
    那麼問題來了,為什麼需要了解這些數據類型呢?因為不知道數據類型,將會不知道如何應用正確的統計方法處理這類數據。舉例來說,如果數據框中有一列有序號數據,就必須要進行預處理,在Python中,scikit-learn包提供了一個序號編碼器來處理序號數據。