近幾年應用公開的資料庫發生信文章蔚然成風,但入門門檻稍高,需要掌握遺傳學知識和計算機語言。
今天,筆者想通過這篇文章總結一些國外的非生信資料庫,為大家提供另一種選擇。
1. National Institute on Alcohol Abuse and Alcoholism Data Archive (NIAAADA,美國國家酒精濫用資料庫)
網址:
https://nda.nih.gov/niaaa
獲得數據的英文指南網址:
https://nda.nih.gov/niaaa/getting-data
適用的研究方向/領域:酒精濫用,應該可以與心血管疾病結合。
優點:NIAAADA 的數據可向任何人分享,即使沒有 NDA 的帳號也可以。
缺點:需要證明您所在的機構是 NIH 承認的研究機構。
免費與否:免費。
是否需要註冊:總結的數據不需要註冊。個體水平數據需要註冊、研究計劃、申請。
瀏覽器要求:最好使用 Chrome 瀏覽器。
NIAAADA 的數據可向任何人分享,即使沒有 NDA 的帳號也可以。這包括一些總結的數據,比如測量了哪些變量,和這些變量的總體分布。
如果想得到個體水平的數據,研究者需要滿足一定的前提條件,在進行 NDA 的申請後獲得授權。
NDA 的數據申請會由一個特別的委員會審核,向 NDA 遞交申請需要註冊 NDA 的帳號。
獲取數據的前提:
-必須認真說明有獲得數據的研究需要。
-你必須在 NIH 承認的研究機構內,且這個機構授權你這麼做。
2. International Physical Activity and the Environment Network(IPEN)
網址:
http://www.ipenproject.org/faq.html
適用的研究方向/領域:
運動對健康的影響,城市建築環境對健康的影響,可以結合肥胖、糖尿病、心血管疾病等與運動有關的慢性病進行研究。
優點:該團隊已經用該數據在 Lancet 上發表了文章。
缺點:該項目上一次情況的更新是 4 年前,可能回覆郵件不一定及時。
免費與否:免費。
是否需要註冊:不需要。但需要向該組織發郵件進行溝通。
瀏覽器要求:無
該資料庫涉及到城市環境與健康(運動)的關係,是美國加州大學聖地牙哥分校教授牽頭的聯盟。
官網最後一次更新是 2014 年,這個聯盟在 2016 年在 Lancet 主刊發了一篇成果(https://pubmed.ncbi.nlm.nih.gov/27045735/),想了解數據具體是什麼的可以去看這篇文章,這篇文章的通訊作者是聖地牙哥分校的 James F Sallis 教授。
如何用 IPEN 的數據寫文章了?
向 IPEN 團隊(郵箱 ipen@ucsd.edu)提交預備發表文章的研究計劃申請即可。
3. National Survey on Drug Use and Health(NSDUH,美國藥物使用和健康調查)
網址:
https://nsduhweb.rti.org/respweb/homepage.cfm
適用的研究方向/領域:藥物濫用,如阿片類、醫用大麻類。
優點: 網站自帶回歸、卡方檢驗的分析工具,可以自己選取輸入的變量,操作簡便、友好。
缺點:該主題對於中國社會意義不是很大。不過,可以試著挖一挖止痛劑濫用方向的點,可能結合一下中國學者的研究興趣。
免費與否:免費。
是否需要註冊:需要註冊。
瀏覽器要求:建議使用 Chrome 瀏覽器。
眾所周知,美國藥物濫用情況還是略嚴重,是一個緊迫的社會問題。
這個資料庫是可直接使用性最強的,在網頁上有自動模塊,可以操作卡方回歸和 logistics 回歸。我曾經和導師交流時,導師也很推薦這個資料庫。
4. National Institute of Mental Health Data Archive(美國國家精神健康資料庫,NDA)
網 址:
https://nda.nih.gov/
適用的研究方向/領域:精神健康。
優點:是美國該領域數據非常全面的官方機構。
缺點:但相較前面幾個資料庫,申請時較為麻煩。
免費與否:免費。
是否需要註冊:需要註冊。
瀏覽器要求:建議使用 Chrome 瀏覽器或者 360 瀏覽器。
FQA 環節中有解答數據的詳細情況,但需要聯繫官方,提交申請,才能獲取數據。
5. Women Health Initiative(女性健康聯盟)
網址:
https://www.whi.org/
適用的研究方向/領域:女性健康、運動對女性健康的影響。
優點:久負盛名的數據聯盟,數據質量高。
缺點:申請過程較以上 1、2、3 資料庫相對繁瑣。
免費與否:免費。
是否需要註冊:需要,且需要提供研究計劃。
瀏覽器要求:建議使用 Chrome 瀏覽器。
這是運動和心血管健康聯盟(OPACH)之下的一個子研究,需要操作一下才能打開主頁。這個研究用可穿戴設備檢測老年婦女的運動和心血管健康。
如何獲取數據發表文章的指南在這裡:
https://www.whi.org/page/propose-a-paper
6. UK biobank
網 址:
https://www.ukbiobank.ac.uk/
適用的研究方向/領域:
基因、包含了各種重大疾病,如各種癌症、心血管疾病、中風、痴呆、糖尿病、關節炎、骨質疏鬆、眼部疾病、抑鬱等。
優點:包含了 50 萬人基因數據、多種表型的大型資料庫,已經很多人利用該資料庫產出孟德爾隨機研究的高質量文章。
缺點:需要交幾千英鎊甚至更多的申請費(視申請數據的種類而定)。
免費與否:需付費。
是否需要註冊:需要註冊,且需要有研究方案。
瀏覽器要求:建議使用 Chrome 瀏覽器。
該資料庫收集了 50 萬英國人的基因數據和其他流行病學特徵,像廣闊的海洋,值得深挖。
缺點就是需要收取一定的費用,從網上的攻略來看,發一篇一般的文章(數據量不是很大),大概需要 2250 英鎊左右。
7. Surveillance, Epidemiology, and End Results(SEER,美國癌症監測資料庫)
網址:
https://seer.cancer.gov/
適用的研究方向/領域:癌症和癌症的預後研究,各種死因的研究。
優點:涵蓋了各種癌症和死亡的數據,非常全面。
缺點:僅有一部分數據是免費的。
免費與否:部分免費。
是否需要註冊:需要註冊。
瀏覽器要求:建議使用 Chrome 瀏覽器。
這個資料庫估計聽過的小夥伴比較多。一部分數據是可以免費獲得的,可以用數據做比較簡單的 logistics 回歸(據說都是能發 2-3 分的文章)。
在搜尋引擎上搜索,也會發現大量的中文資源教大家怎麼使用 SEER 資料庫。
這麼多資料庫,除了 UK Biobank,其他都是可以直接免費獲得或者提交研究計劃後免費獲得。
以上,就是今天分享的內容,希望對你有幫助。#木木西裡#
看完文章,善良的你不如動動小手指轉發出去,讓更多人看到呀~
內容來源:科研論文時間
這本期刊被JCR鎮壓,沒有影響因子卻是中科院一區,自引率高達37%
重磅!這個生信神器助你文章秒出圖——miRNA與基因互作資料庫
他在屍檢時偷走患者大腦,切成240塊私藏43年:史上最瘋狂的醫生
特別聲明:本文發布僅僅出於傳播信息需要,並不代表本公共號觀點;如其他媒體、網站或個人從本公眾號轉載使用,請向原作者申請,並自負版權等法律責任。