國外臨床公開資料庫大盤點:未被挖掘的小眾非生信資料庫有哪些?

2020-12-06 木木西裡科技

近幾年應用公開的資料庫發生信文章蔚然成風,但入門門檻稍高,需要掌握遺傳學知識和計算機語言。

今天,筆者想通過這篇文章總結一些國外的非生信資料庫,為大家提供另一種選擇。

1. National Institute on Alcohol Abuse and Alcoholism Data Archive (NIAAADA,美國國家酒精濫用資料庫)

網址:

https://nda.nih.gov/niaaa

獲得數據的英文指南網址:

https://nda.nih.gov/niaaa/getting-data

適用的研究方向/領域:酒精濫用,應該可以與心血管疾病結合。

優點:NIAAADA 的數據可向任何人分享,即使沒有 NDA 的帳號也可以。

缺點:需要證明您所在的機構是 NIH 承認的研究機構。

免費與否:免費。

是否需要註冊:總結的數據不需要註冊。個體水平數據需要註冊、研究計劃、申請。

瀏覽器要求:最好使用 Chrome 瀏覽器。

圖片來源:官網截圖

NIAAADA 的數據可向任何人分享,即使沒有 NDA 的帳號也可以。這包括一些總結的數據,比如測量了哪些變量,和這些變量的總體分布。

如果想得到個體水平的數據,研究者需要滿足一定的前提條件,在進行 NDA 的申請後獲得授權。

NDA 的數據申請會由一個特別的委員會審核,向 NDA 遞交申請需要註冊 NDA 的帳號。

獲取數據的前提:

-必須認真說明有獲得數據的研究需要。

-你必須在 NIH 承認的研究機構內,且這個機構授權你這麼做。

2. International Physical Activity and the Environment Network(IPEN)

網址:

http://www.ipenproject.org/faq.html

適用的研究方向/領域:

運動對健康的影響,城市建築環境對健康的影響,可以結合肥胖、糖尿病、心血管疾病等與運動有關的慢性病進行研究。

優點:該團隊已經用該數據在 Lancet 上發表了文章。

缺點:該項目上一次情況的更新是 4 年前,可能回覆郵件不一定及時。

免費與否:免費。

是否需要註冊:不需要。但需要向該組織發郵件進行溝通。

瀏覽器要求:

圖片來源:官網截圖

該資料庫涉及到城市環境與健康(運動)的關係,是美國加州大學聖地牙哥分校教授牽頭的聯盟。

官網最後一次更新是 2014 年,這個聯盟在 2016 年在 Lancet 主刊發了一篇成果(https://pubmed.ncbi.nlm.nih.gov/27045735/),想了解數據具體是什麼的可以去看這篇文章,這篇文章的通訊作者是聖地牙哥分校的 James F Sallis 教授。

如何用 IPEN 的數據寫文章了?

向 IPEN 團隊(郵箱 ipen@ucsd.edu)提交預備發表文章的研究計劃申請即可。

3. National Survey on Drug Use and Health(NSDUH,美國藥物使用和健康調查)

網址:

https://nsduhweb.rti.org/respweb/homepage.cfm

適用的研究方向/領域:藥物濫用,如阿片類、醫用大麻類。

優點: 網站自帶回歸、卡方檢驗的分析工具,可以自己選取輸入的變量,操作簡便、友好。

缺點:該主題對於中國社會意義不是很大。不過,可以試著挖一挖止痛劑濫用方向的點,可能結合一下中國學者的研究興趣。

免費與否:免費。

是否需要註冊:需要註冊。

瀏覽器要求:建議使用 Chrome 瀏覽器。

圖片來源:官網截圖

眾所周知,美國藥物濫用情況還是略嚴重,是一個緊迫的社會問題。

這個資料庫是可直接使用性最強的,在網頁上有自動模塊,可以操作卡方回歸和 logistics 回歸。我曾經和導師交流時,導師也很推薦這個資料庫。

4. National Institute of Mental Health Data Archive(美國國家精神健康資料庫,NDA)

網 址:

https://nda.nih.gov/

適用的研究方向/領域:精神健康。

優點:是美國該領域數據非常全面的官方機構。

缺點:但相較前面幾個資料庫,申請時較為麻煩。

免費與否:免費。

是否需要註冊:需要註冊。

瀏覽器要求:建議使用 Chrome 瀏覽器或者 360 瀏覽器。

圖片來源:官網截圖
圖片來源:官網截圖

FQA 環節中有解答數據的詳細情況,但需要聯繫官方,提交申請,才能獲取數據。

5. Women Health Initiative(女性健康聯盟)

網址:

https://www.whi.org/

適用的研究方向/領域:女性健康、運動對女性健康的影響。

優點:久負盛名的數據聯盟,數據質量高。

缺點:申請過程較以上 1、2、3 資料庫相對繁瑣。

免費與否:免費。

是否需要註冊:需要,且需要提供研究計劃。

瀏覽器要求:建議使用 Chrome 瀏覽器。

圖片來源:官網截圖

這是運動和心血管健康聯盟(OPACH)之下的一個子研究,需要操作一下才能打開主頁。這個研究用可穿戴設備檢測老年婦女的運動和心血管健康。

如何獲取數據發表文章的指南在這裡:

https://www.whi.org/page/propose-a-paper

6. UK biobank

網 址:

https://www.ukbiobank.ac.uk/

適用的研究方向/領域:

基因、包含了各種重大疾病,如各種癌症、心血管疾病、中風、痴呆、糖尿病、關節炎、骨質疏鬆、眼部疾病、抑鬱等。

優點:包含了 50 萬人基因數據、多種表型的大型資料庫,已經很多人利用該資料庫產出孟德爾隨機研究的高質量文章。

缺點:需要交幾千英鎊甚至更多的申請費(視申請數據的種類而定)。

免費與否:需付費。

是否需要註冊:需要註冊,且需要有研究方案。

瀏覽器要求建議使用 Chrome 瀏覽器。

圖片來源:官網截圖

該資料庫收集了 50 萬英國人的基因數據和其他流行病學特徵,像廣闊的海洋,值得深挖。

缺點就是需要收取一定的費用,從網上的攻略來看,發一篇一般的文章(數據量不是很大),大概需要 2250 英鎊左右。

7. Surveillance, Epidemiology, and End Results(SEER,美國癌症監測資料庫)

網址:

https://seer.cancer.gov/

適用的研究方向/領域:癌症和癌症的預後研究,各種死因的研究。

優點:涵蓋了各種癌症和死亡的數據,非常全面。

缺點:僅有一部分數據是免費的。

免費與否:部分免費。

是否需要註冊:需要註冊。

瀏覽器要求:建議使用 Chrome 瀏覽器。

圖片來源:官網截圖

這個資料庫估計聽過的小夥伴比較多。一部分數據是可以免費獲得的,可以用數據做比較簡單的 logistics 回歸(據說都是能發 2-3 分的文章)。

在搜尋引擎上搜索,也會發現大量的中文資源教大家怎麼使用 SEER 資料庫。

這麼多資料庫,除了 UK Biobank,其他都是可以直接免費獲得或者提交研究計劃後免費獲得。

以上,就是今天分享的內容,希望對你有幫助。#木木西裡#

看完文章,善良的你不如動動小手指轉發出去,讓更多人看到呀~

內容來源:科研論文時間

這本期刊被JCR鎮壓,沒有影響因子卻是中科院一區,自引率高達37%

重磅!這個生信神器助你文章秒出圖——miRNA與基因互作資料庫

他在屍檢時偷走患者大腦,切成240塊私藏43年:史上最瘋狂的醫生

特別聲明:本文發布僅僅出於傳播信息需要,並不代表本公共號觀點;如其他媒體、網站或個人從本公眾號轉載使用,請向原作者申請,並自負版權等法律責任。

相關焦點

  • 免費資源丨超實用的生物信息學資料庫挖掘教程大禮包分享
    然而,並不是每一個人都有這樣的條件。很多的臨床醫生並沒有自己的專屬實驗室、也沒有基金,更沒有大量的時間投入到科研項目中。然而,如果我們可以充分的分析總結別人的實驗成果,也不難從中發現前人未發現的現象和結論,不失為一種不用做實驗就能發文章的門路。我們熟知的Meta薈萃分析就是屬於此種研究類型。
  • 即搜即用的TCGA資料庫挖掘網站匯總
    其中level1/2為controlled-access,level-3有部分是controlled-access,這一類型的需要向TCGA申請使用權限,而大部分普通用戶只能訪問Level3的部分處理及標準化的數據。
  • 大數據挖掘——(六):MySql資料庫
    mysql資料庫MySQL 是最流行的關係型資料庫管理系統,在WEB應用方面 MySQL 是最好的RDBMS(Relational Database Management System:關係資料庫管理系統)應用軟體之一,MySQL 是開源的,並且支持多種語言,包括C、C++、Python、Java、
  • 確認過眼神,是值得挖掘的單細胞測序資料庫
    考慮到單細胞測序的火熱趨勢,目前介紹的單細胞測序結果的專業資料庫主要包括:scRNASeqDB和 SCPortalen: human and mouse single-cell centricdatabase.,其中scRNASeqDB主要收錄的是來自 GEO的生物醫學單細胞測序數據。
  • 國外學位論文資料庫
    國外的學位論文有很高的參考價值,是碩博研究生和科研人員常需要參考查閱的國外論文文獻之一。但是在國內想找到國外學位論文並不容易,而且也沒有正規的檢索渠道,都是零零散散的不會,這對查找起來很不容易,效率非常低下。
  • 盤點|國內天然產物資料庫
    天然產物是新藥發現的重要源泉,天然產物化學成分實物庫與資料庫的建設對天然產物的研究與開發有重要的意義。本文就目前國內可以公開查詢到的有關天然產物的實物庫和資料庫建設情況進行概述,希望對天然產物的研究與開發有所幫助。
  • 打造資料庫安全壁壘 布局未來雲端安全
    《極客網》:安華金和為什麼要把自己鎖定在資料庫安全市場?創建安華金和前,您個人有哪些相關經歷? 劉曉韜:安華金和的創業團隊之前是做資料庫研發的,有十多年的專業經驗。我們認為當前市場對資料庫安全的需求迫在眉睫。
  • 生物資料庫那麼多,你知道幾個?這個工具可以讓你找到想要的資料庫
    ,常用的資料庫,大家都耳熟聞詳,但生命科學領域的資料庫是很多的,很多資料庫你可能都沒聽過,特別是一些小眾的資料庫,有時候,我們想看某一領域是不是有專門的資料庫,那就得去查資料,搜文獻,好像有點效率低下,這裡給大家推薦一個資料庫搜索工具——Database Commons。
  • 騰訊雲發布圖資料庫TGDB 助力國產資料庫進一步打破技術「天花板」
    來源:中國證券網上證報中國證券網訊(記者 溫婷)騰訊雲6月1日發布分布式圖資料庫產品騰訊雲數圖TGDB(Tencent Graph Database)。這款資料庫能夠實現萬億級關聯關係數據實時查詢,高效治理異構數據,支持實時圖計算,助力企業打通數據孤島。騰訊雲圖資料庫產品經理邵宗文表示:「騰訊雲資料庫完善的自研資料庫體系和產品體系,將助力國產資料庫進一步打破技術『天花板』,全面助推各行各業數位化升級。」在5G、物聯網、人工智慧等數位化技術推動下,企業數據呈爆發式增長,數據間的關聯複雜度也隨之劇增。
  • 科學網—玉米多組學資料庫上線了
    該資料庫內嵌了基因組「瀏覽器」和「搜尋引擎」,從而實現了對相關組學生物大數據的高度集成、快速檢索和智能分析。 此前,我國玉米基礎研究取得了顯著成績,但在其研究材料和數據的共享平臺建設上有待加強。該資料庫的建立,不僅幫助用戶提升了對作物組學數據挖掘的時間效率,更實現了多維組學大數據之間的聯繫,在打通信息「孤島」上邁出有力一步。
  • 美國將開放資料庫促進新材料研發—新聞—科學網
    科技日報北京8月16日電 (記者李文龍)據美國白宮科技政策辦公室網站消息,美國近期將向公眾開放多個材料學資料庫,以此促進新材料的研發與合成。
  • 12月在線資料庫匯總|資料庫|甲基化|DNA|標誌物|預測|分析|-健康界
    在12月期間,總共發表了醫學相關在線資料庫47個。下面就來給大家介紹一下主要有哪些資料庫,以及筆者比較感興趣的資料庫。1. 疾病與藥物相關資料庫疾病和藥物相關的資料庫一共有5個。涉及到多種不同的疾病。
  • DTCC 2020:資料庫工程師眼中的資料庫市場
    韋萬:大家好,我來自 PingCAP,是一名資料庫內核研發工程師。目前主要負責 TiDB 的實時分析方向存儲側的研發工作,關注資料庫、高性能計算和分布式系統等技術方向。  IT168:資料庫內核研發在大家看來似乎是份很神秘的工作,內核工程師每天的工作內容有哪些?
  • DECIPHER:疾病相關的CNV資料庫
    DECIPHER是一項國際化的合作項目,是一個由200多個臨床中心和1600多個遺傳學家和實驗室構成的聯盟,從各種生物信息資源中進行數據整合,提供了一套全面的工具來識別與患者表型相關的基因組結構變異,挖掘潛在的致病基因,所有的成果存在在一個在線資料庫中,方便科學家查看和利用,對應的文章發表在Nucleic Acids Research上,文章連結如下
  • 大數據時代下的化學資料庫
    在現今的社會,大數據的應用越來越彰顯他的優勢,它佔領的領域也越來越大,電子商務、O2O、物流配送等,各種利用大數據進行發展的領域正在協助企業不斷地發展新業務,創新運營模式。有了大數據這個概念,對於消費者行為的判斷,產品銷售量的預測,精確的營銷範圍以及存貨的補給已經得到全面的改善與優化。
  • 知網被查凸顯文獻資料庫行業困境
    《財經》記者通過知網員工獲得的一份知網《關於媒體報導不實之處的說明》(下稱《說明》)稱,武漢理工大學圖書館五年內採購知網資料庫經費翻番的說法「純屬捏造」,該館採購經費大幅增長是因為採購了新的資料庫產品。  《說明》稱,資料庫每年有公開報價和穩定的調價規則。定價依據是出版內容的數量、質量,以及產品的增值服務功能。產品的研發、出版成本每年不同,「適當提高產品的基本價格是有充分依據的」。
  • 「出生即王者」,騰訊雲圖資料庫TGDB實現萬億級數據實時查詢
    6月1日,騰訊雲正式發布分布式圖資料庫產品騰訊雲數圖TGDB(Tencent Graph Database)。這款資料庫能夠實現萬億級關聯關係數據實時查詢,高效治理異構數據,支持實時圖計算,助力企業打通數據孤島。同時,深度挖掘大數據中的隱藏關聯關係,幫助企業構築全局視角,釋放潛在商業價值。
  • 32天,他們創建了冠狀病毒資源資料庫平臺
    ◎ 金鳳 通訊員 姜晨 姜佳彤115例新型冠狀病毒感染兒童的臨床特點分析、武漢同濟醫院醫務人員2019新型冠狀病毒感染相關因素的病例對照研究、洛匹那韋/利託那韋對新型冠狀病毒肺炎患者血脂水平的影響……3月26日,記者從中國藥科大學獲悉,該校基礎醫學與臨床藥學學院2018級藥理學專業博士生孫慶榮帶領團隊成功開發出一個冠狀病毒資源資料庫
  • STRING:蛋白質相互作用(PPI網絡)資料庫簡介
    研究蛋白之間的相互作用網絡,有助於挖掘核心的調控基因,目前已經有很多的蛋白質相互作用的資料庫,而string絕對是其中覆蓋的物種最多,相互作用信息做大的一個,網址如下https://string-db.org/該資料庫的最新版本為version 10.5, 更新於2017年5月14號,