【網絡文明微課堂】你要的所有數據源都在這裡了!

2020-12-01 澎湃新聞

作為數據分析師,經常需要查詢一些數據來完善方案邏輯和分析結果,因此整理了一些常用數據網站,分享給大家。

1. 常用數據源

1.1國家數據

連結:http://data.stats.gov.cn/index.htm (國家數據)

數據來源於中國國家統計局,包含了我國經濟民生等多個方面的數據,並且在月度、季度、年度都有覆蓋,較為全面和權威,對於社會科學的研究不要太有幫助。最關鍵的是,網站簡潔美觀,還有專門的可視化讀物。

1.2 CEIC

連結:http://www.ceicdata.com/zh-hans (Global Economic Data, Indicators, Charts & Forecasts)

最完整的一套超過128個國家的經濟數據,能夠精確查找GPD,CPI,進口,出口,外資直接投資,零售,銷售,以及國際利率等深度數據。其中的「中國經濟資料庫」收編了300000多條時間序列數據,數據內容涵蓋宏觀經濟數據、行業經濟數據和地區經濟數據。

1.3 Wind資訊

連結:http://www.wind.com.cn/ (Wind資訊--中國領先的金融數據和分析工具服務商)

萬得被譽為中國的Bloomberg,在金融業有著全面的數據覆蓋,金融數據的類目更新非常快,據說很受國內的商業分析者和投資人的親睞。

1.4搜數網

連結:http://www.soshoo.com/ (新版搜數網 - 中國資訊行)

已加載到搜數網站的統計資料達到7874本,涵蓋1761009張統計表格和364580479個統計數據,匯集了中國資訊行自92年以來收集的所有統計和調查數據,並提供多樣化的搜索功能。

1.5中國統計信息網

連結:http://www.tjcn.org/ (中國統計信息網)

國家統計局的官方網站,匯集了海量的全國各級政府各年度的國民經濟和社會發展統計信息,建立了以統計公報為主,年鑑、階段發展數據、統計分析、經濟新聞、主要統計指標排行等。

1.6亞馬遜aws

http://aws.amazon.com/cn/datasets/?nc1

來自亞馬遜的跨科學雲數據平臺,包含化學、生物、經濟等多個領域的數據集。

1.7 figshare

連結:https://figshare.com/ (credit for all your research)

研究成果共享平臺,在這裡你會發現來自世界的大牛們的研究成果分享,同時get其中的研究數據,內容很有啟發性。

1.8 github

連結:https://github.com/caesar0301

如果覺得前面的數據源還不夠,github上的大神已經為大家整理好了一個非常全面的數據獲取渠道,包含各個細分領域的資料庫資源,自然科學和社會科學的覆蓋都很全面,簡直是做研究和數據分析的利器。

1.9世界城市CAD

連結:https://cadmapper.com/

分享世界各大城市的CAD文件,有些城市的老一些,湊合用用還是可以的。

1.10企信網

連結:http://www.qixin.com/ (企業註冊信息查詢|企業工商信息查詢|企業信用信息查詢平臺-啟信寶)

啟信寶是蘇州貝爾塔數據技術有限公司旗下的一款企業徵信產品,旨在為用戶提供快速查詢企業工商信息、法院判決信息、關聯企業信息、司法拍賣信息、失信信息、被執行人信息、智慧財產權信息、公司新聞、招聘信息等服務。通過多模式查詢,多選項篩選,讓查詢結果更準確,查詢內容更詳盡!是泛金融,泛投資,泛法律和泛商務(如銷售、採購)相關人士的首選工具!

1.11環境雲

連結:http://www.envicloud.cn/ (環境雲-環境大數據免費開放平臺)

環境雲是環境大數據服務平臺,是南京雲創大數據科技股份有限公司最新研發出的一款全面、穩定、便捷、免費的環境數據開放服務平臺。

環境雲環境大數據服務平臺通過獲取權威數據源(中國氣象網、中央氣象臺、國家環保部數據中心、美國全球地震信息中心等等)所發布的各類環境數據,以及雲創自主布建的各類全國性環境監控傳感器網絡。

1.12 PM2.5

連結:http://pm25.in/

為大家提供空氣品質監測數據的網站,數據採自於國家環境保護部。

1.13世界銀行公開數據

連結:http://data.worldbank.org.cn/ (Data | The World Bank)

世界銀行公開數據,免費並公開獲取世界各國的發展數據。

1.14中國統計年鑑

連結:http://www.stats.gov.cn/tjsj/ndsj/ (中華人民共和國國家統計局>>中國統計年鑑)

中國統計年檢,國家統計局出品。

1.15體育大數據

連結:http://www.sportsdt.com/ (體育大數據 - 首頁)

2. 交易數據

2.1優易數據

連結:http://www.youedata.com/ (優易數據_大數據交易創新平臺_數據定製_數據交易_數據API)

2.2數據堂

連結:http://www.datatang.com/ (數據堂_大數據交易平臺)

專注於網際網路綜合數據交易,提供數據交易、處理和數據分析,包含語音識別、醫療健康、交通地理、電子商務、社交網絡、圖像識別等方面的數據。

2.3數據淘

連結:http://datataotao.com/ (數據淘)

數據淘是一個數據垂直搜索工具,同時也是數據供需雙方免費溝通交流的平臺。

2.4數據寶

連結:http://www.chinadatapay.com/ (中國數據寶-大數據交易平臺)

首個省部共建的大數據資產運營管理平臺。

3. 指數數據研究

3 .1百度指數

http://index.baidu.com/ (百度指數)

大家都很熟悉的指數查詢平臺,可以根據指數的變化查看某個主題在各個時間段受關注的情況,進行趨勢分析、預測有很好的指導作用。除了關注趨勢之外,還有需求分析、人群畫像等精準分析的工具,對於市場調研來說具有很好的參考意義。同樣的另外兩個搜尋引擎搜狗、360也有類似的產品,都可以作為參考。

3 .2阿里指數

https://alizs.taobao.com/ (阿里指數 - 社會化大數據分析平臺)

國內權威的商品交易分析工具,可以按地域、按行業查看商品搜索和交易數據,基於淘寶、天貓和1688平臺的交易數據基本能夠看出國內商品交易的概況,對於趨勢分析、行業觀察意義不小。

3.3艾瑞諮詢

連結:http://www.iresearch.com.cn/ (艾瑞諮詢-生活夢想 科技承載)

艾瑞作為老牌的網際網路研究機構,在數據的沉澱和數據分析上都有得天獨厚的優勢,在網際網路的趨勢和行業發展數據分析上面比較權威,艾瑞的網際網路分析報告可以說是網際網路研究的必讀刊物。

3.4友盟指數

http://www.umeng.com/ (【友盟+】全球領先的第三方全域大數據服務提供商)

友盟在移動網際網路應用數據統計和分析具有較為全面的統計和分析,對於研究移動端產品、做市場調研、用戶行為分析很有幫助。除了友盟指數,友盟的網際網路報告同樣是了解網際網路趨勢的優秀讀物。

3.5愛奇藝指數

連結:http://index.iqiyi.com/ (愛奇藝指數_首頁)

愛奇藝指數是專門針對視頻的播放行為、趨勢的分析平臺,對於網際網路視頻的播放有著全面的統計和分析,涉及到播放趨勢、播放設備、用戶畫像、地域分布、等多個方面。由於愛奇藝龐大的用戶基數,該指數基本可以說明實際情況。

3.6貓眼專業版

http://piaofang.maoyan.com/ (貓眼專業版)

電影票房統計分析平臺,貓眼專業版有實時的票房統計,影片的排盤情況、上座率和影院數據,對於當前電影的分析是必不可少的。

3.7龍信創新指數

http://www.longcredit.com/UpIoadFiles/FTP_Upload/langrunlongxin/index.html

為助力「全民創新」、「全民創業」,北京大學國家發展研究院與龍信數據合作,綜合利用企業大資料庫、專利資料庫、商標數據,創建了目前由誕生創業者數量、獲得風險投資、專利獲得、商標註冊、新增企業註冊數、獲得外來投資等6個維度構成的綜合反映地區創新成果的創新指數。第一份研究報告暨2013年全國各省市區、城市百強和縣域百強等三個層面的地區創新指數排名,已於2015年6月25日正式發布。

3.8中國城市擁堵排行榜

http://report.amap.com/index.do (高德交通--中國主要城市交通分析報告)

報告是基於高德積累的海量交通出行數據,通過大數據挖掘計算所得,通用算法與理論保證了其合理性與科學性。報告採用「擁堵延時指數」作為城市擁堵程度的評價指標,即城市居民平均一次出行實際旅行時間與自由流狀態下旅行時間的比值該指數從交通出行者的角度出發,以簡單易懂的方式表達交通擁堵給出行者帶來的時間成本。此報告客觀地從多維度反映城市的交通擁堵狀況,力爭做到精準、精細、精確,為公眾交通出行、機構研究、政府決策提供有價值的理論參考依據。

4. 研究機構

4.1 BCL北京城市實驗室

http://www.beijingcitylab.com/ (Home)

4.2 CityFormLab

連結:http://cityform.mit.edu/projects (Projects — City Form Lab)

4.3城市數據實驗室

連結:http://lic.urbandatalab.com/ (Technology Innovation Center of THUPDI)

4.4北大軌跡數據可視化

連結:http://vis.pku.edu.cn/trajectoryvis/

5. 數據採集

5.1火車頭

http://www.locoy.com/ (火車採集器官網-網頁抓取工具_火車頭採集器_免費網站採集軟體)

一款專業的網際網路數據抓取、處理、分析,挖掘軟體,可以靈活迅速地抓取網頁上散亂分布的數據信息,並通過一系列的分析處理,準確挖掘出所需數據,最常用的就是採集某些網站的文字、圖片、數據等在線資源。接口比較齊全,支持的擴展比較好用。

5.2八爪魚

http://www.bazhuayu.com/ (八爪魚採集器 - 最好用的網頁數據採集器)

簡單實用的採集器,功能齊全,操作簡單,不用寫規則。特有的雲採集,關機也可以在雲伺服器上運行採集任務。

5.3集搜客

http://www.gooseeker.com/ (免費網頁抓取軟體-網絡爬蟲工具-GooSeeker網絡爬蟲)

一款簡單易用的網頁信息抓取軟體,能夠抓取網頁文字、圖表、超連結等多種網頁元素,提供好用的網頁抓取軟體、數據挖掘攻略、行業資訊和前沿科技等。

6. API接口數據

6.1 Haoservice

http://www.haoservice.com/ (API數據接口_開發者數據定製_免費數據調用_好服務數據)

為企業提供準確、全面、快捷的一站式數據服務平臺,是北京暢遊互聯旗下數據平臺。

6.2圖像識別開放平臺

連結:https://www.tuputech.com/api (試用與文檔|圖普科技)

6.3天狗雲

連結:http://www.tngou.net/doc#healthy (天狗雲文檔中心-API接口_健康、醫療、生活、農業開放平臺)

6.4極速數據

連結:http://www.jisuapi.com/

6.5百度API商店

連結:http://apistore.baidu.com/ (API Store_為開發者提供最全面的API服務)

6.6聚合數據

連結:https://www.juhe.cn/ (API數據接口_開發者數據定製_免費數據調用-聚合數據)

來源:數據源公眾號

網信清河

微信公眾號:qhwxbgs

清河縣網際網路信息辦公室官方帳號

原標題:《【網絡文明微課堂】你要的所有數據源都在這裡了!》

閱讀原文

相關焦點

  • 你想知道的駕駛證業務流程全在這裡了!(三)|交管業務辦理微課堂
    你想知道的駕駛證業務流程全在這裡了!(一) | 交管業務辦理微課堂 你想知道的駕駛證業務流程全在這裡了!(二) | 交管業務辦理微課堂
  • 初中物理微課堂《4.5光的色散》
    往期推文:初中物理微課堂《4.4光的折射
  • 乾貨|你想知道的數據倉庫知識,這裡都有!
    集成:對原有分散的資料庫數據經過系統加工、整理,消除源數據中的不一致性。穩定:數據進入數據倉庫以後只需要定期的加載、刷新,不需要頻繁修改。反映歷史變化:出於決策的需要,數據倉庫中的數據都要標明時間屬性。通過這些數據信息,對企業的發展歷程和未來趨勢做出定量分析預測。——資料庫與數據倉庫的區別資料庫和數據倉庫其實很相似,都是通過資料庫管理系統,來組織、存儲和管理數據。
  • Python數據分析入門教程(一):獲取數據源
    作者 | CDA數據分析師俗話說,巧婦難為無米之炊。不管你廚藝有多好,如果沒有食材,也做不出香甜可口的飯菜來,所以想要做出飯菜來,首先要做的就是要買米買菜。而數據分析就好比是做飯,首先也應該是準備食材,也就是獲取數據源。一、導入外部數據導入數據主要用到的是Pandas裡的read_x()方法,x表示待導入文件的格式。
  • 婦幼常識微課堂(五)|重視聽力篩查,早發現、早幹預。
    婦幼常識微課堂(五)|重視聽力篩查,早發現、早幹預。據了解,2006年全國殘疾人抽樣調查數據顯示,我國有聽力障礙患者2780萬人,佔全國殘疾人的33.5%,為各類殘疾之首。在我國,每年有3萬左右聾兒出生,其中大部分為重度、極重度惑音性神經性耳聾。自20世紀90年代起,世界發達國家和許多發展中國家均開展了新生兒聽力篩查,為先天性耳聾患兒早期診斷與幹預提供保障。聲音是怎樣傳進耳朵的?
  • 關於外星文明的幾種猜想,最後一種碾壓其他所有文明
    人類是社會動物,需要彼此關聯,於是將這種「關聯」也帶入到我們對外星文明的想像中去了。這種猜想中「巧合」太多啦,難不成所有外星生命所處自然環境與進化發展歷程都與人類相似?就算同在一個地球,那麼多物種中與人類相似的又有幾個呢?2.「集體智慧」類型的外星文明:此類文明類似於「蜂群」、「蟻群」,一個「蟻后」作為「大腦」指揮所有「工蟻」。
  • 水漢字、水成語、水故事有哪些 這場微課堂帶你了解
    近日,開發區治水辦邀杭州市第一屆「優秀民間護水達人」榮譽獲得團體——浙江水利水電學院水資源協會,走進文清小學,開展「體水藝術,悟水精神」水藝術微課堂宣講
  • 【黨務微課堂】支部大會通過接收預備黨員的決議怎麼寫?
    【黨務微課堂】支部大會通過接收預備黨員的決議怎麼寫?>喜歡此內容的人還喜歡原標題:《【黨務微課堂】支部大會通過接收預備黨員的決議怎麼寫?》
  • 雲計算數據中心網絡技術全面剖析
    數據中心多站點的選路問題受大二層互通影響更加複雜。 題內話,FCoE並不是雲計算的需求,而是數據中心以網絡為核心演進的需求,至於雲計算裡面是不是一定要實現以網絡為核心,就看你是站在哪個設備商的角度來看了。 4?
  • 關於一維表,你想知道的都在這裡了
    數據分析的源數據應該是規範的,而規範的其中一個標準就是數據源應該是一維表,它會讓之後的數據分析工作變得簡單高效。
  • 收藏 一條微信看懂所有電光源光譜
    燒熱了也都發光。沒錯,這哥們發的光,就是靠電流「燒」出來的。4、高壓鈉燈發光原理:扔個彩蛋在這裡吧,如果實在厭倦度娘,又找不到谷哥,其實有一個搜尋引擎超級好用:www.baigoogledu.com,據說這兩個網站搜出來的東西80%不一樣。一般人我不告訴他。
  • 二手車高手都這樣找車源,你還在翻朋友圈?
    身邊許多想要買二手車的朋友時常都會過來問小編,我們去哪裡二手車車源比較合適?那些二手車高手都是哪裡找的優質車源的二手車? 其實我們自己個人和那些老練的車商不一樣,沒有他們那種身後的行業人脈資源,也沒有他們所謂的二手4s店探子。
  • 入門實例操作:BI工具如何連接數據源資料庫?
    以往咱們分享的操作步驟都稍微有些複雜,大家跟著步驟操作也有些二丈摸不著頭腦,看來簡單的操作步驟和功能概念還是有必要普及的,那今天就來說一點簡單的入門操作知識,那就是BI工具億信ABI為例子展示如何連接資料庫數據源,其他工具我不知道,但這款工具挺實用的,複雜表格,領導駕駛艙,大屏展示,圖文日常報告,拖拽分析應用。還有一些數據處理的功能,應用場景豐富。
  • 丨一建微課堂
    文/音頻  學天教育大家好,歡迎來到學天教育《水利》微課堂,今天我們來學習利水電工程施工測量的要求
  • Siphon使用IGRA2為數據源畫探空圖
    來自粉絲「青羽」的投稿Siphon 還提供了 Integrated Global Radiosonde Archive (IGRA2)為數據源的數據管道IGRA2的更新比較慢,反正是3月份這回的中國區基本都是提示無數據;訪問也很慢,不清楚是牆的原因還是網站本身技術的原因,和Matlab啟動速度有的一拼;代碼比懷俄明的那個稍微複雜些,因為他提供的數據參量更多,像位溫,假位溫這樣的都有,懷俄明的只有一個露點。需要精細化比對探空數據的可能需要IGRA2的數據,需要快速分析天氣的更喜歡懷俄明。
  • 如果地球上所有人類突然回到10萬年前,要多久才能恢復現代文明?
    因此我們可以認為,如果地球上所有人類突然回到10萬年前,人類文明發展的速度將因為現代人的知識儲備而大幅增加,那麼在這種情況下的人類大概要多久才能恢復現代文明呢?下面我們就來簡單討論一下這個話題。如果地球上所有人類突然回到10萬年前會怎麼樣?
  • 宇宙中所有文明都懼怕「黑暗森林法則」,為何歸零者直接無視?
    宇宙中所有文明都懼怕「黑暗森林法則」,為何歸零者直接無視?科幻巨作《三體》在國內外可謂是家喻戶曉,因劉慈欣一人就將中國的科幻小說推向了世界的高度。三體中的故事情節以及各種法則都是人們經常談論的話題,其中最著名的就是黑暗森林法則。
  • 考考你,這些數據分析常用術語你都分清楚了嗎?
    數據湖使得訪問企業級數據更加容易,你需要明確你要尋找什麼,以及如何處理它並明智地試用它。暗數據(Dark Data):基本上指的是,由企業收集和處理的,但並不用於任何意義性目的的數據,因此它是「暗」的,可能永遠不會被分析。它可以是社交網絡反饋,呼叫中心日誌,會議筆記等等。有很多人估計,所有企業數據中的 60-90% 可能是「暗數據」,但誰又真正知道呢?
  • 網絡架構--數據中心的「神經脈絡」
    01、網絡分區與等保一般情況下,本著靈活、安全、易管理的設計原則,企業都會對數據中心網絡的物理設備進行分區。通常情況下,數據中心都會採用核心—匯聚—接入三層的網絡結構,核心用於所有流量的快速轉發,而匯聚則是在每個網絡分區上,擔任網關的功能。
  • 網絡層中帶有IP的數據包結構詳解
    從左上角開始version表示版本號,在2018年流行的版本有兩種,IPV4和IPV6,你們用的網都是IPV4。headerLength見名知意就是報頭長度,範圍從20~60個字節。dsField全名Differentiated Services Field,它被用於QOS全名quality of Service網絡服務質量,他能夠解決網絡中的卡頓問題。