大數據給統計工作帶來的挑戰

2020-11-30 中國信息報

■ 鄭寶金 

    隨著雲計算技術概念的提出和發展,社會經濟正邁入大數據時代。所謂的大數據時代就是人們獲取的信息量劇增,獲取信息的渠道也越來越廣泛,信息趨向於網絡化、廣泛化、公開化。每天數據都在以千變萬化的形式展現在我們面前,這也使人們對統計數據的質量越來越關注,大數據給統計工作帶來了前所未有的壓力和挑戰,但同時也帶來了機遇。
    
    大數據的特徵
    
    大數據不簡單等同於「大」的數據,這一概念最初來源於IT界,是一種數據集合,覆蓋範圍廣泛,由海量數據組成,具有極其重要的戰略資源價值。可以將其特徵歸納為四個「V」:數量(Volume),多樣性(Variety),價值(Value),速度(Velocity)。大數據時代數據衡量度越來越向縱深定義,數據體量巨大,類型繁多,相較於傳統數據挖掘分析技術,雲計算、人工智慧等新興大數據技術的數據分析處理能力愈加強大。
    
    數據質量的內涵
    
    政府統計是指國家機關依照法律法規運用各種統計方法和手段對國民經濟和社會發展情況進行統計調查、分析,為政府決策層提供理論和數據支持的一種政府活動。統計數據作為衡量國民經濟、社會發展的重要指標,其質量的高低直接影響市場經濟是否能夠持續健康發展及人民生活水平穩步提高。確保為政府決策提供及時、精準、科學的統計數據,高效發揮統計服務職能,實現數據分析資料的快速更新,需要統計工作人員運用大數據技術手段,創新統計數據處理方式,提高統計數據質量,讓統計工作成為經濟社會健康發展的穩固基石。
    
    帶來的挑戰
    
    海量數據衝擊傳統統計方法。大數據時代來臨後,面對繁雜、海量的數據信息,以往統計工作中的紙質報表統計、人工數據採集、簡易平臺分析處理的方法,會顯得十分吃力、費時,無限延長信息處理時間,難以保證統計數據時效性,給統計信息庫存儲、更新、傳輸等方面帶來壓力。並且分散數據信息之間的關聯性,難以形成數據共享機制,降低統計數據處理分析能力,從而造成統計分析資料的片面、缺失和不真實,統計工作容易出現偏差。
    數據採集渠道單一,部門間配合度有待提高。隨著網絡、移動終端的迅猛發展,網絡空間產生了規模龐大的數據信息。這類數據往往覆蓋多個領域並具有差異性和動態性,傳統的信息數據採集方法和單一政府部門提供統計數據的思維方式已然無法滿足統計分析工作的數據需要。因為行政體制設置,沒有明文規定部門間有信息共享的義務,數據信息在部門間不能有效流通,造成數據之間、部門之間孤立,容易形成信息孤島,進而加大工作量,影響數據權威性,難以提升統計工作的現代化水平。
    統計人員業務能力有待提高。一些地方統計人員對統計專業知識、統計法律知識、現代化統計技術手段掌握不全面,主動學習不夠,業務培訓少,無法適應大數據時代對統計人員業務素質的要求。
(作者單位:國家統計局盤錦調查隊)

相關焦點

  • 異質性和共性是大數據兩大挑戰
    範劍青  什麼是大數據?大數據究竟能做什麼?大數據時代的機會與挑戰分別是什麼?  如今面對無處不在的大數據,卻很少有人可以清楚地回答出以上這三個問題。  日前,以「大數據時代,統計無處不在」為主題的問學講堂在復旦大學管理學院舉行。在此期間,《國際金融報》記者遇見了美國普林斯頓大學運籌與金融工程系系主任範劍青。
  • 大數據和新經濟時代背景下,新經濟統計學的機遇與挑戰
    大數據背景下新經濟統計面臨的挑戰與機遇大數據時代,萬物互聯正在成為現實,萬物皆數也將逐步實現。數據泛在化,宏觀經濟系統完全被智能連接,數字經濟形態下,人類通過網際網路、雲計算、區塊鏈、物聯網和相應產生的大數據實現了資源的快速優化配置與再生。社會經濟和人民生活優質發展,經濟統計的內涵和外延也 正在改變重塑。那麼,大數據背景下,新經濟統計面臨著怎樣的挑戰與機遇呢?
  • 「大數據+監測」提升統計精確度
    日前,記者從區統計局隊獲悉,其將全面開啟「大數據+」統計工作新局面,不斷嘗試將大數據新技術引入統計工作各個領域,用大數據助力統計調查和普查,提升海澱統計工作水平和服務地區發展的能力。2015年開始,區統計局隊率先嘗試採用移動通信大數據技術進行人口動態監測和分析研究,開啟了統計監測工作的新天地。經過幾年的發展,大數據技術應用從人口監測到經普清查、民生調查,促進了區統計局隊工作效率和統計現代化水平的提升。統計監測領域也由原來的企業發展、群眾安全感擴展到商業、社區民生等多個領域,統計服務區域發展的水平進一步提高。
  • 大數據可視化技術的挑戰及應對措施
    在大數據時代,數據可視化技術在廣泛應用的同時,也面臨諸多新的挑戰。大數據可視化是一個面向應用的研究領域,本文重點從應用實踐的角度,討論在大數據背景下大數據可視化內涵、研究進展、相關技術與產品以及所面臨的一系列挑戰。
  • 2015.09:網際網路大數據在政府統計中的應用路徑研究(「大數據在政府...
    本文以網際網路大數據為背景,結合政府統計工作的特點,提出了網際網路大數據在政府統計中的應用路徑,並以網際網路搜索數據在房價統計方面的應用進行了案例研究,提出了網際網路大數據在政府統計應用中的展望。批發零售業統計。   由於網上電商交易數據的量體非常大、更新速度快,而且在全社會商品零售貿易中所佔比重越來越大。因此,充分利用這些信息可以為改善傳統的批發零售貿易業統計帶來新的思路。
  • ...堅決維護統計工作權威 確保統計數據經得起實踐人民歷史的檢驗
    他強調,要深入學習貫徹習近平總書記重要講話和重要指示批示精神,切實扛起防範和懲治統計造假、弄虛作假的政治責任,嚴格執行統計法律法規,堅決維護統計工作權威,確保統計數據經得起實踐、人民、歷史的檢驗。省委副書記、省長景俊海出席。
  • excel數據統計:三個公式提高統計工作效率
    在日常的辦公中,我們經常會統計excel裡各種數據。在excel裡關於統計的函數也是數不勝數,SUM、SUIMIF、SUMIFS、COUNT、COUNTIFS等等。今天我們總結了三類小夥伴們經常遇到的統計問題,也將分享三種對應的解決方法,以後再面對這三類統計問題,就再也不怕啦~****************善於在工作中使用函數、公式可以提高工作效率,結合近期學員們遇到的問題,老菜鳥總結了三個非常實用的公式,每個公式都可以解決一類問題。學會這三個公式套路,就能解決日常遇到的很多麻煩事。
  • 2020年統計數據中心工作總結 - 伊春
    2020年工作總結 2020年,統計數管中心在局領導的高度重視和指導下,經過統計數管中心全體人員的共同努力,在全局同志的大力支持下,按照年初工作部署,加大信息化基礎建設投入,強化計算機網絡安全和信息安全,提高計算機信息化服務水平,為統計數據運算與數據報送做好技術支撐工作
  • 中國工程院院士徐宗本:大數據的挑戰和問題
    在方法論方面,大數據帶來了三大挑戰。  大數據的挑戰和問題  談論大數據是時代話題,擁有大數據是時代特徵,解讀大數據是時代任務,應用大數據是時代機遇。這四句話概括出大數據時代。從本質上說,數據,就是指資料的信息化、數位化,大數據的複雜性體現在四個方面,第一,海量性;第二,實踐性;第三,異構性;第四,分布性。
  • 奮進中的中國統計:城市統計工作成績斐然
    改革開放以來,城市統計調查工作的領域不斷拓寬,統計制度方法不斷改進完善,統計調查數據質量穩步提高,服務水平全面提升,為滿足國家宏觀調控和社會公眾的需要,發揮了不可替代的重要作用。,統計制度及方法不斷完善,數據質量也得到不斷提升。
  • 奮進中的中國統計:我國服務業統計工作成就和展望
    19年間,服務業統計標準逐漸健全,統計制度不斷完善,統計隊伍逐步壯大,統計內容日臻豐富。辛勤耕耘終獲豐碩成果,時至今日,我國的服務業統計數據已經能夠較為真實地反映我國服務業發展狀況,較好地滿足各級黨政機關正確決策和廣大社會公眾獲知信息的需求。
  • 空間大數據:機遇與挑戰並存—新聞—科學網
    挖掘空間大數據的價值 「大數據已經上升為國家戰略,而幾乎所有的大數據,都需要而且可以與地理信息數據緊密融合。」泰伯創始人、董事長兼CEO劉玉璋表示,空間大數據是大數據與地理信息數據的融合體。由此,空間大數據正在全球範圍內迅速崛起,給政府用戶、企業用戶與個人用戶提供前所未有的應用價值和服務能力。
  • 吳軍《數學之美》:大數據的數學基礎和大數據的利弊
    「大數據」是怎麼一回事呢?它就是我們字面意思理解的「大量的數據」嗎?如果不是,這兩者又有什麼聯繫和區別呢?大數據是隨著信息技術的發展而興起的,當數據的計算和存儲不再是問題時,人們發現超大量的數據會給我們決策帶來驚喜,這才有了更多的人研究和應用大數據。首先,大數據的數據量肯定是非常大的,但光是量大還不能稱之為大數據。
  • 大數據時代,數據分析師的報考條件是什麼?
    隨著網際網路的迅速發展,人已經進入大數據時代,在大數據時代,數據分析、數據挖掘工作面臨著機遇與挑戰,特別是近幾年,大數據已逐漸走進商業、政府、科研、教育、醫療等各行業。同時,也給商業、政府、科研、教育、醫療等各行業帶來了不小的危機感。
  • 2018.11:大數據在政府統計中的應用、瓶頸及融合路徑(餘芳東)
    本文系統梳理當前政府統計應用大數據的基本類型,研究探索大數據統計應用實踐和基本方法思路,剖析大數據統計應用面臨的困難和瓶頸,提出推進大數據與政府統計工作融合的路徑。大數據的統計應用既有數據獲取和質量上的困難,也有技術和方法上的瓶頸。
  • 每個數據科學家都必須了解的5大統計概念
    統計和數據科學的重要支柱任何數據科學家都可以從數據集中收集信息-任何優秀的數據科學家都將知道,紮實的統計基礎可以收集有用和可靠的信息。 沒有它,就不可能進行高質量的數據科學。以下是每個數據科學家都應該知道的前五個統計概念:描述性統計,概率分布,降維,過採樣和欠採樣以及貝葉斯統計。讓我們從最簡單的一個開始。
  • 「網際網路+醫療」健康醫療大數據能帶來什麼?
    「網際網路+醫療」健康醫療大數據能帶來什麼?  ——訪市中心醫院副院長、中國衛生信息與健康醫療大數據學會網際網路醫院專業委員會副主任委員楊國慶  「網際網路+醫療」給人們帶來的舒適就醫體驗,正在讓大家拋棄傳統的就醫模式。   正如大家剛熟悉的移動端預約掛號繳費,新的就醫模式又接踵而至了。   「在『網際網路+醫療』建設過程中,我們前期已經做了很多基礎性的工作,打通醫院各應用系統與網際網路醫院平臺的數據交換接口等等。」楊國慶表示,伴隨著「網際網路+醫療」工作的不斷推進。如何採用先進的信息技術讓老百姓就醫更便捷?
  • 運用大數據處理技術 做好國有企業思想政治工作
    在全面深化企業改革和網際網路全面普及的新形勢下,國有企業思想政治工作面臨著許多新情況,國有企業要勇於挑戰自我、求新達變,積極推進思想政治工作理念創新、手段創新,要善於運用計算機大數據處理技術,積極構建大數據思想政治工作管控體系,確保職工隊伍穩定,使企業思想政治工作煥發出勃勃生機,為企業改革發展提供強有力的思想保障
  • 課題組:國家碳排放核算工作的現狀、問題及挑戰
    我國雖已初步建立了碳排放核算方法,並開展了5個年份的清單核算工作,但仍存在工作機制不完善、方法體系相對落後、能源消費及部分化石能源碳排放因子統計基礎偏差大、碳排放核算結果缺乏年度連續性等現實問題,影響了國家發布的溫室氣體排放清單核算數據的權威性。
  • 數據科學投資可以帶來豐厚的回報
    許多人還計劃在明年實施更多工具,報告指出有46%的人缺乏用於和諧使用這些工具的集成平臺,我們發現的主要技術和數據挑戰反映了這種集成方法的缺乏,公司採用基於平臺的方法來進行數據科學和高級分析,洞察力領導人認識到他們的競爭優勢通常來自於他們快速優化洞察力應用程式的速度,平臺統一了數據科學家所需的工具開發和部署這些應用程式,將您的數據科學工具視為一個互聯平臺,並朝著整合和統一它們的方向邁出的步伐,對於任何公司而言都是朝著正確方向邁出的重要一步