一般來說,想挖掘GEO資料庫的公共數據集,最後發表時候都要引用該數據集的原始文獻。一個GSE數據集會關聯到一個原始文獻,比如:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE90604可以看到其關聯的文章是:Simultaneous miRNA and mRNA transcriptome profiling of glioblastoma samples reveals a novel set of OncomiR candidates and their target genes. Brain Res 2018 Dec 1;1700:199-210. PMID: 30176243
甚至一個GSE數據集關聯更多文獻,如果這個數據集被挖掘過。比如:
當然,並不是說這個GEO數據集被多次挖掘,就一定要關聯到多個文章,比如:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE4107 它其實至少被挖掘了五次。
更嚴重的是有些時候,你感興趣的GEO數據集沒有關聯到原始文獻出處。比如:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE104267如下所示:
GEO數據集沒有關聯到原始文獻出處
其實可以,根據作者單位,上面寫的是:顧建欽. Jianqin Gu. 河南省人民醫院. Henan Provincial People 's Hospital
或者搜索 郵箱;dangyuan830307@hotmail.com 多次反覆搜索,查到了對應的真實作者:Dang, Yuan dangyuan830307@hotmail.com
World J Surg Oncol. 2015 Oct 1 Expression and clinical significance of long non-coding RNA HNF1A-AS1 in human gastric cancer.World J Surg Oncol. 2018 Mar Evaluation of the expression and clinical value of lncRNA AC010761.9 in human gastric adenocarcinoma.其實上面我舉例的第一個例子最開始也是沒有關聯文獻的,我當時是谷歌搜索:Sukru Gulluoglu Yeditepe University
https://www.researchgate.net/profile/Sukru_Gulluogluhttps://sg.linkedin.com/in/sukru-gulluoglu-42576827https://scholar.google.com.tr/citations?hl=en&user=COkIAXYAAAAJ&view_op=list_works&sortby=pubdate甚至還能查到作者的其它數據集:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE88721
我們感興趣的數據集相關文章應該是:https://www.sciencedirect.com/science/article/pii/S0006899318304578?via%3Dihub 作者的差異分析結果是:1332 genes and 319 miRNAs were found to be dysregulated by the microarrays. 正文清清楚楚的提到了:GEO Series accession number GSE90604 (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE90604).
然後我聯繫了GEO官方,把這個文獻關聯上去了這個數據集頁面。
嘻嘻,如果你在挖掘GEO數據集的同時,也發現了那些並沒有關聯到原始文獻的,而且你成功找到了就通知一下GEO官方哈。
絕大部分同學是R或者Linux基礎知識掌握的不牢固,並不是我的視頻課程錄製的不夠好!
不點讚也不打賞,為什麼呢?