導讀
越來越多的應用涉及到大數據,不幸的是所有大數據的屬性,包括數量、速度、多樣性等等都是描述了資料庫不斷增長的複雜性。
越來越多的應用涉及到大數據,不幸的是所有大數據的屬性,包括數量、速度、多樣性等等都是描述了資料庫不斷增長的複雜性。那麼大數據給我們帶來了什麼好處呢?大數據最大的好處在於能夠讓我們從這些數據中分析出很多智能的、深入的、有價值的信息。
1、信息分析的原理
信息分析主要以事物、現象、數據、信息的屬性、特徵、本質、規律、關聯等為依據展開定性和定量分析,以期發現新知識。因此,信息分析以事物、現象、數據、信息之間存在的因果關係或相關關係為基礎。關係是指事物之間因為時間、秩序、結構、運動等產生的聯繫,包括時間、空間、發生和發展邏輯(包括流程,如工業流程、業務流程等;規律,如生命體的生老病死循環、自然運動規律等)
事物、現象、數據、信息之間的關係十分複雜且多種多樣,但都可歸為不確定關係和確定性關係兩種,不確定性關係主要是相關關係,是定性分析的基礎,確定性關係主要是數量關係,是定量分析的基礎
2、信息分析的思維模式
(1)樣本微觀分析:信息分析以數據、信息和現象為對象,一般是從全體或總體中選擇部分樣本進行分析,稱為樣本分析或抽樣分析。
(2)定性和定量分析:以相關關係為基礎,採用定性方法分析樣本的本質、規律、特徵、屬性、聯繫;以因果關係為基礎,採用數學和統計學模型定量描述或擬合樣本的特徵、規律和聯繫。樣本間的定量關係通常不是嚴格的函數關係,而是近似的函數關係,需要用函數關係近似地描述相關關係,這樣必然存在誤差,因此需要對樣本間的函數關係進行各種檢驗,控制誤差。
(3)趨勢外推分析:以定性和定量分析得到的樣本的本質、規律、特徵、屬性、聯繫等為基礎進行趨勢外推,擴大到全體或總體,並進行總體預測或估計
3、信息分析的方法與工具
信息分析方法主要源於邏輯學方法、系統分析方法、圖書情報學方法(如文獻計量學方法、引文分析法)、社會學方法、統計學方法、數學方法等,一般分為哲學方法、一般方法、具體方法三個層次,具體分析方法通常又分為定性方法、定量方法和半定量方法三大類。
其中定性方法主要有邏輯思維和科學思維方法,包括分類與比較、分析與綜合、歸納與演繹、類比與想像等。定量方法主要有多元分析法(如相關分析、回歸分析、聚類分析等)、時間序列分析法(如移動平均、指數平滑、線性趨勢、季節指數等)、文獻計量方法等。半定量方法主要有內容分析法、層次分析法、德爾菲法等
信息分析的工具主要有四大類:
一是社會調查和專家調查工具;
二是邏輯思維工具;
三是數學和統計模型;
四是資料庫和計算機數據挖掘工具
這些方法和工具可以從不同的角度和層面對數據、信息與現象進行分析,為科學管理和科學決策提供必要的定性和定量依據.
中琛魔方大數據分析平臺 (www.zcmorefun.com)