如何利用NCBI-GEO探索目標基因在模型中的表達!!花別人的錢,為你開路!

2021-02-20 醫療小道

   

最近雜事一堆各種糾結時常感覺心塞,剛好有老師做心肌梗死的,問我說想初步判斷幾個自己感興趣基因在模型中的表達情況。我就整理了一下如何利用NCBI-GEO資料庫查詢對感興趣的基因在自己研究方向上的豐度。

好吧,就還是以心塞為例吧!心塞大家都經歷過吧,就是傳說中的心肌梗死,哎我能說我是文盲嗎?心肌梗死英文咋說的?我大概只記得小米了。對就是屌絲專用機的MI。

NCBI-GEO大家可玩過?

Gene Expression Omnibus (GEO) Profiles and Datasets。簡單點說就是一個開放的高通量檢測資料庫,對你沒看錯它就是開放的。其實這樣的開放資料庫還不少!做科研嘛,心裡有底點-安心。另外沒錢就先用別人的數據。以後有機會和大家扯下單純用別人的數據如何分析發SCI吧!

看名字似乎是只有表達層面(RNA & DNA)的數據,額這個RNA嘛也有mi/lnc/mRNA等等的嘛。


但事實上它也是包含大量的DNA層面高通量檢測數據,比如SNP/CNV/甲基化晶片、外顯子組測序、全基因組重測序神馬等等的。

好吧,扯得遠了,心塞嚴重起來。還是去找小米發騷吧!原諒我,我是南方淫!!正常點吧!!!


1、首先打開NCBI,搜索「myocardial infarction」。


2、進入如下界面。

看到上圖春色方框了吧?
簡單說,GEO Datasets是指有多少個項目數據,GEO Profiles是指有多少個樣本數據。注意到了吧,這個keyword數據真尼瑪多。我們點擊GEO datasets看看。


可能再詳細點解釋下?哎懶癌開始顯現,別怪我,下次的吧。

另外這麼多項目/樣本你準備要我自己一個一個找?噢,忘了這兩資料庫有高級搜索。

3、GEO profiles高級搜索

點擊搜索得到如下結果:

5、確認profiles對應GEO datasets信息

好吧第一個模型似乎和我想的一樣,但還是點擊GEO datasets看看詳情吧。


您最好點擊原文查看更加具體情況。

5、假設第四步中的第一條信息通過geo datasets查詢確認。點擊右側柱狀圖。

看的夠詳細了吧。對了,組間差異倍數?

總結出來了吧?FC(fold change)是指MI組/對照組的差異倍數,其中底數為2,指數為組間value平均數之差。注意這兒的value是晶片信號值取完log2後的值。

到此我們基本可以搞定自己感興趣基因的表達情況。但是我們也希望全局的看待自己研究模型中所有基因的表達情況,希期可以發現比較新的功能基因,下次有機會再和大家扯一下如何利用GEO資料庫實現吧!

相關焦點

  • 單細胞數據上傳GEO操作指南
    利用這個資料庫,我們可以公開共享自己的實驗測序數據,也可以檢索到其他文章上傳的數據。很多文章在正式見刊前會要求將數據上傳到GEO資料庫中,具體如何操作呢?/geo/info/examples/seq_template.xlsx)。
  • 利用NCBI查詢基因的組織表達譜
    我們在研究某個基因的功能之前,首先可能想知道這個基因在某組織中有沒有表達,或者表達量高還是低。本期就為大家講解如何利用NCBI查詢某個基因的組織表達譜。 1.打開NCBI官網後,在下拉選項框中選擇Gene,在文本框裡輸入想要查詢的基因的名稱並帶上物種,點擊Search。這裡我們查詢一下EGFR基因在小鼠各組織的表達譜。
  • 收藏|一圖介紹GEO資料庫
    GEO資料庫全稱GENE EXPRESSION OMNIBUS,是由美國國立生物技術信息中心NCBI創建並維護的基因表達資料庫。它創建於2000年,收錄了世界各國研究機構提交的高通量基因表達數據,也就是說只要是目前已經發表的論文,論文中涉及到的基因表達檢測的數據都可以通過這個資料庫中找到。關鍵是這個數據是免費的!
  • 如何利用NCBI開始甲基化課題
    在哺乳動物中CpG以兩種形式存在:一種是分散於DNA序列中;另一種呈現高度聚集狀態,人們稱之為CpG島(CpG island)。
  • 什麼,你感興趣的GEO數據集沒有關聯到原始文獻出處
    一個GSE數據集會關聯到一個原始文獻,比如:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?比如:當然,並不是說這個GEO數據集被多次挖掘,就一定要關聯到多個文章,比如:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE4107 它其實至少被挖掘了五次。
  • NCBI介紹
    NCBI 的所有資料庫和程序軟體都可在 NCBI 的匿名 FTP伺服器( ftp : //ncbi.nlm.nih.org )上獲取。  隨著ncbi資料庫各種資源的湧現,NCBI已經成為科研工作者必不可少的工具了。那麼各位小夥伴們,你能說出NCBI有多少資料庫嗎?有哪些實用的工具嗎?不知道的就進來看看吧!
  • Biopython —— 你不知道的 NCBI 訪問方式
    Biopython 致力於通過創造高質量和可重複利用的 Python 模塊及類,使 Python 在生物信息學中的應用變得更加容易。利用這個庫,我們可以編寫腳本,讓程序自動搜索下載資料庫中的信息不用為搜索幾十上百個基因的相關文獻發愁,也不用再為尋找幾十個基因的序列、轉錄本信息等愁得焦頭爛額了Biopython 能幹嘛 ?
  • 差異基因表達分析(上)
    公共資料庫當然,如果你要研究一個基因的功能時,不要先急著去花錢找公司測序,先去一些基因表達公共資料庫找找看:http://www.ebi.ac.uk/arrayexpress/https://www.ncbi.nlm.nih.gov/geo/差異表達(differential expression,DE)基因分析通過研究基因的差異表達,我們可以發現
  • 不用編程,鎖定非腫瘤領域的關鍵基因
    從分子的角度進行切入,無論是基礎科研領域的模型、檢測方法還是標誌物,還是生信分析中的富集分析、互作網絡、臨床預測模型的建立,都緊緊圍繞這一認識深度展開。分子該怎麼找呢?入門門檻太高,我要教大家的技巧,是五分鐘快速學會在自己研究領域中定位到差異表達基因或者關鍵基因。接下來,我就以抑鬱症這個非腫瘤領域的疾病為例,和大家聊一聊如何只用在線資料庫,輕鬆點點,就能鎖定非腫瘤領域的關鍵基因。
  • NCBI微生物基因組批量下載
    親愛的科研同僚們,在曲折的探索道路上是否還在為找不到目標物種的基因組而抓耳撓腮?不要哭,今天小編就為大家提供幾個批量下載某物種或特定物種基因組並獲取基因組預測及注釋信息的方法。1、ftp://ftp.ncbi.nlm.nih.gov/genomes/GENOME_REPORTS主要是在分類學水平上對物種基因組信息以文件夾的形式歸類,最終基因組整理統計的基本信息展示在Browse網站(第二部分詳述)(1) ftp://ftp.ncbi.nlm.nih.gov/genomes/all/ (2) ftp://ftp.ncbi.nlm.nih.gov
  • 如何使用 NCBI 查找基因序列、mRNA、Promoter | 實驗
    主要有以下四部分內容:今天我們就先講第一部分:如何查找基因序列、mRNA、Promoter。這裡主要用到的是 Map viewer,我們以人的 IL6(白細胞介素 6)為例講述一下具體的操作步驟。1.打開 Map viewer 頁面,網址為:http://www.ncbi.nlm.nih.gov/mapview/index.html,在 search 的下拉菜單裡選擇物種,for 後面填寫你的目的基因。操作完畢如下圖所示。
  • 使用BioNumerics軟體批量下載NCBI中基因序列
    使用BioNumerics軟體批量下載NCBI中基因序列大家可能曾經都被如何批量下載NCBI中的數據所困擾,在NCBI的網站上苦苦搜尋,但是無從下手。本文將介紹如何通過BioNumerics軟體實現基因序列的批量下載。
  • 如何利用GROW模型提升決策效率?
    GROW模型可以用來改善各個方面的決策:從決定公司的戰略,到搞清楚如何做一個好父母,或如何計劃你一天的安排。這不是什麼高科技,也不是什麼革命性的新方法或諾貝爾獎式的發現。 人們一直在設定目標,理清現狀,找出方案和決定行動。GROW模型只是給了我們一個更加有序且系統性的方法來幫我們優化以前做事的方法。
  • NCBI教程|如何從NCBI批量下載序列並用MEGA畫進化樹
    後,利用序列的NC號或者GI號直接搜索下載即可。首先創建一個需要下載序列的NC號的列表文件,每行一個獨立的NC號,保存為文本文件,如下圖:備註:NC號即為完整的基因組分子序列,標記的類別包括基因組、染色體、細胞器、質粒等。
  • 水母新發光蛋白的發現,為探索基因如何在細胞中表達帶來新的技術
    現在,Shaner和他的團隊已經在A. australis水母體內發現了五種新的螢光蛋白,這一發現可能會為探索基因如何在細胞中表達Shaner和他的團隊對A. australis水母的轉錄組進行測序後,Shaner驚奇地發現在A. australis水母體內表達的基因有幾種與綠色螢光蛋白GFP相似,GFP蛋白在過去幾十年被用來追蹤細胞中的蛋白質,甚至製造了在黑暗中發光的貓,三位研究人員在2008年因發現和開發了螢光探針GFP
  • 單細胞RT-PCR表達量數據也可以差異分析
    研究者們首先通過流式預先把細胞分類,分成:basal/stem, luminal, and luminal progenitor cells這3群細胞,如下所示:流式細胞分選首先看了看3群細胞的不同病人的表達量差異情況,一般來說,做差異分析的話,組內差異肯定是要小於組間差異
  • 玩轉基因組瀏覽器之利用IGV查找motif結合位點
    motif在基因組上結合位點的查找是生信分析中的一項基本技能,在轉錄因子的chip_seq, m6A_seq等落雨都有廣泛應用,之前也寫了很多的文章來介紹motif本文以最近非常火熱的RNA甲基化測序m6A_seq為例,來展示下IGV的motif結合位點查找功能, 眾所周知,m6A修飾位點的motif序列為RRACH, 通過peak calling我們可以識別到包含
  • Genome Biology|VIPER:在單細胞RNA測序中為精確的基因表達恢復...
    例如,scRNA-seq已被應用於對新細胞亞型和細胞狀態進行分類,進行空間定位,鑑定差異表達基因,以及研究基因表達變異的遺傳基礎。但是,由於RNA轉錄組的數量較少以及基因表達的隨機性,在scRNA-seq數據中有很高的概率將非零值判斷為零,這被稱為「dropout」事件。
  • Science子刊:利用反義寡核苷酸增加SCN1A表達,有望治療Dravet症候群
    2020年8月31日訊/生物谷BIOON/---在一項新的研究中,一種有前景的實驗性新療法似乎可以改變Dravet症候群(Dravet syndrome)小鼠模型中的破壞性疾病進展。這一發現最終有可能給患有這種疾病的兒童及其父母帶來希望。
  • 研究利用單細胞表型探索細胞內基因互作
    研究利用單細胞表型探索細胞內基因互作 作者:小柯機器人 發布時間:2019/8/23 13:57:17 美國加州大學舊金山分校Jonathan S. Weissman、Luke A.