世界上最大的癌基因資料庫—Oncomine來了

2021-01-17 貴科大數據

(1)網址登陸:

https://www.oncomine.org/resource/login.html

(2)Oncomine是什麼?

Oncomine是目前世界上最大的癌基因晶片資料庫以及癌基因數據挖掘平臺,整合了GEO、TCGA和已發表文獻等來源的RNA和DNA-seq數據;該資料庫擁有全世界最全面的癌症突變譜、基因表達數據以及相關的臨床信息,可用作發現新的生物邊際物或尋找新的治療靶點。


劃重點來了:Oncomine免費使用,但需要使用學術研究機構(例後綴為.edu的郵箱)的郵箱註冊

(3)帳號註冊

登錄界面(頁面1):點擊紅框進行註冊,跳轉頁面2

所有選框必填(頁面2),填寫完整後點擊submit,會將帳號和臨時密碼發送到填寫的郵箱中。註冊完畢後,登錄進入主界面,跳轉頁面3

(4)Oncomine數據展現基本操作

主界面(頁面3),其中有搜索框,並且可以設置篩選類型,其中有很多可選項,如紅色框所示:

以LACTB基因為例(頁面4):在search框輸入基因名稱LACTB,在filter框選擇分析類型(analysis type)以及癌症類型(cancer type);之後再閾值選擇部分(threshold)選擇P-值(P-VALUE)、倍數(FOLD-CHANGE)、GENE RANK值分別為1E-4/2/10%,如下圖紅框4所示:

選擇Hong Colorectal選項(頁面5),就可得到右側的圖,展示每個樣本中TP53的表達結果:

點擊紅色框1可以轉換結果表達形式(頁面6)在這裡,我們以箱圖數據為例,演示操作教程;點擊紅框2可以得到該數據集的基本屬性總結,包含主體、作者、機構、實驗類型、數據連結等:

(5)數據集下載

頁面6中點擊紅框2得到數據集基本屬性(頁面7),其中包含數據連結(Data Links):

點擊數據連結進入GEO界面,跳轉至頁面8,點擊「Analyze with GEO2R」分析按鈕(紅色框):

點擊Define Groups(紅色框),新建兩個組名tumor和normal並將數據加入對應的組,如下圖(頁面9),藍色背景數據被加入tumor組,共70條,紅色背景數據被加入normal組,共12條。

頁面9往下拖,點擊profile graph,進入頁面10,輸入基因在該晶片裡的代號(代號可以在Oncomine界面裡的篩選結果中找到,下圖中reporter旁邊的紅框裡),然後點擊頁面10的set, 得到頁面10展示結果。

點擊紅框1裡的sample values,出現頁面11所示結果,得到作圖的最終數據(紅框2)。

複製紅框2數據到excel表格文件中,就可以使用其他作圖工具做出其他類型的圖,例如專業作圖工具graphpad。

總結:因為Oncomine所提供的的數據展示方法的局限(僅箱圖展示),本教程僅介紹了如何從Oncomine資料庫中導出所需要的基因表達數據,使得研究者可以利用其它作圖工具(例:graphpad或python編程作圖包matplotlib等)作出相較於箱圖更利於表達分析結果的圖表類型。


相關焦點

  • Oncomine:腫瘤晶片資料庫
    然而這些數據來自不同的組織和團隊,由於缺乏統一的數據管理和組織,這些數據在發表之後就沒有再利用了,為了提高數據利用率,促進腫瘤研究的發展,Oncomine的開發團隊收集了各種來源的腫瘤相關的晶片數據,用標準化的分析流程處理這些數據,數據分析的結果通過web服務查詢和可視化,對應的文章連結如下https://www.ncbi.nlm.nih.gov/pmc/articles
  • COSMIC:最大的【癌症基因突變】的資料庫
    今天給大家安利一個超強的資料庫:COSMIC。該資料庫主要由英國威康信託基金會桑格研究所(Wellcome Trust Sanger Institute)開發和運作,2004 年發布第一個版本,2017 年 2 月 13 日發布了最新的第 80 個版本(v80),以後每 3 個月更新一次。這個資料庫有專門的團隊維護,不可以自己上傳數據,如果你希望上傳,可以聯繫他們的團隊。
  • Nature最新論文驚人發現,最強癌基因竟然不在染色體上……
    雖然上世紀60年代便有人發現了這種環狀DNA的存在,也知道它會攜帶癌基因。但從前沒人直接觀察過ecDNA、沒人指出它對腫瘤的生長有多關鍵。而Nature發布的新研究中,科學家終於首次直接觀察了ecDNA (不止基因測序) ,並證明了它的重要性:ecDNA上的癌基因,是腫瘤的整個基因轉錄組當中,表達水平最高的那部分基因。而染色體上癌基因的表達相對較低。
  • 終於來了!傳說中的Oncomine! 【基因數據挖掘專題第十三期】
    今天,我們要介紹一個全新的、大名鼎鼎的資料庫——Oncomine為了更加形象地幫大家理解這個詞,我們不妨解釋為Oncology Mining而這個資料庫,可以讓我們站在更高的一個位置來觀察所有相關研究的晶片結果,這一點會在這一節講課中會為大家展示。另外,據統計,該資料庫收集了約500種腫瘤的基因表達和樣本數據。
  • ASM啟用世界最大材料科學資料庫 收錄百年文獻 搜索技術簡潔
    【據asminternational網站2020年9月24日報導】ASM國際協會啟用材料數據科學平臺(MPDS),該平臺是世界是上最大和最全面的無機材料資料庫,資料庫收錄了從1900年到現在世界各地的文獻,內容涵蓋材料相關的物理、機械、電氣、光學、磁等多學科內容。
  • 姜海/張雷發現新型原癌基因以及Hippo通路新調控因子SHANK2
    因此,系統性地分析腫瘤中某一促癌染色體區段上各個基因的擴增頻率,其中擴增最為頻繁的基因可能是促進腫瘤的原癌基因。然而,此前癌症基因擴增的研究數據少且分散,難以提供足夠多的樣本量以保證上述分析的解析度。近期腫瘤基因組數據的積累為解析這一問題提供了新的機遇。
  • 《Nature》顛覆性發現:癌基因竟然不在染色體上
    中學生物課曾講過正常真核細胞的DNA存在於染色體上,但ecDNA存在於染色體外,這有點反常。沒錯,ecDNA的確不同尋常,因為它總是出現在癌細胞中。早在1965年,《柳葉刀》首次報導了染色體外DNA的存在,半個世紀過去,卻鮮有人重視。
  • 不良飲食習慣會激活「原癌基因」
    前不久,世界頂尖醫學雜誌《柳葉刀》刊登了一項重要研究:在對195個國家和地區的數據進行分析之後,學者們發現,人類的頭號死因,不是感染,不是車禍,而是不良飲食。2018年,不良飲食導致了1100萬例死亡;其中,心血管疾病最多,約1000萬,癌症次之,約90萬。而這個數據具體到中國,大約16%的癌症死亡與飲食有關。
  • Nature重大發現:癌基因竟不在染色體上?第一作者吳思涵親身解讀!
    癌基因的重大發現,癌症研究的曙光TIMEDOO:可否介紹一下該研究的背景呢?吳思涵:腫瘤是一種基因疾病,它是由抑癌基因的功能缺失,以及原癌基因的功能亢進引起的。在高通量測序的時代,我們已經把腫瘤的基因組給測了個遍,把每一個鹼基的突變都測得一清二楚。但現在問題來了:癌基因到底存在於什麼地方?
  • OncoKB:腫瘤藥物靶點相關基因組變異資料庫
    OncoKB收集了腫瘤發生發展相關的,具有臨床意義的基因組變異信息,對於每個變異,提供了其對應的生物學效應,藥物互作,預後和治療意義等詳細信息,對應的文章連結如下http://ascopubs.org/doi/full/10.1200/PO.17.00011資料庫的網址如下
  • 牛皮癬患者細胞死亡和癌基因表達有關係嗎?
    牛皮癬患者細胞死亡和癌基因表達有關係嗎?可能很多的銀屑病患者對於這個問題都沒有想過,畢竟患者發病的部位細胞每時每刻都在死亡,而且正常的身體,細胞也會有死亡的情況,因此對於這個問題很多的患者都沒有意識到,那麼這個情況到底是什麼樣子呢,下面就來給你做一下解答。
  • 中科院自動化所建成世界最大生物特徵樣本資料庫
    記者從中國科學院自動化研究所獲悉,目前,該所已經建成國際上規模最大的多模態生物特徵樣本資料庫,擁有10000多份樣本的虹膜圖像資料庫、各種光照和表情變化下的近紅外和異質人臉圖像資料庫
  • 【每日一練】癌基因和抑癌基因
    二十、癌基因和抑癌基因解析1 解析:B癌基因雖然最早在可導致腫瘤發生的病毒中被鑑定
  • 癌基因敲除可完全抑制肺癌發生
    日前,從中科院昆明動物研究所傳來了好消息,該所腫瘤幹細胞生物學學科組已成功揭示癌基因維持肺癌的發生機制。該成果已在線發表於國際期刊《治療診斷學》。  據介紹,HUWE1基因是一種泛素化連接酶,它可通過調節底物的穩定性,控制著細胞內大量與腫瘤發生密切相關的生物學過程,例如DNA損傷修復、細胞增殖、凋亡、分化以及細胞內穩態等。
  • 世界上最大的「美人指」葡萄樹
    世界紀錄名稱: 戴志興先生的江陰市興旺果園的001號「美人指」葡萄樹是世界上最大的「美人指」葡萄樹。世界紀錄初創者: 戴志興先生的江陰市興旺果園的001號「美人指」葡萄樹。世界紀錄保持者: 戴志興先生的江陰市興旺果園的001號「美人指」葡萄樹。世界紀錄領域: 「美人指」葡萄樹。
  • 五分鐘深度解讀癌基因!致癌?抑癌?必須知!
    癌基因是基因的一類,指人類或其他動物細胞(以及致癌病毒)固有的基因,又稱轉化基因,激活後可促使正常細胞癌變、侵襲及轉移。腫瘤的產生與癌基因(oncogene)和抑癌基因(tumor suppressor gene)有關。凡能參與或直接導致正常細胞發生惡性變的任何基因序列均稱為癌基因。
  • 能搞定最強癌基因KRAS的分子靶向藥物或已上市
    能搞定最強癌基因KRAS的分子靶向藥物或已上市 KRAS應該是最難搞定的癌基因了。 在人體內發現的第一個癌基因,是個「老大難」 1982年,科學家從人膀胱癌細胞系中克隆到了第一個癌基因[4-6],並很快確定這個癌基因是KRAS[7-9]。
  • 科學家發現癌基因在染色體外DNA中擴增 可促進腫瘤發展
    染色體外DNA(ecDNA),是一種從穩定的基因組DNA上脫落下來的DNA,以單鏈或雙鏈環狀存在,可促進腫瘤細胞的癌基因的表達。此外,ecDNA上帶有的原癌基因使腫瘤細胞對環境具有更強的適應性,可以響應腫瘤內部環境的變化。
  • 世界上最大的鐵隕石雨--阿勒泰隕石雨
    這裡是我國隕石最富集的地區也是除南極和西北非沙漠外世界隕石最富集的地區。根據隕石集市「點擊連結中國隕石數據」新疆迄今為止已發現且命名的隕石種類多達三十一種,涵蓋從石隕石、鐵隕石、石鐵隕石所有三大種類,有統計的隕石重量合計52000與公斤。正是這塊沙漠寶地見證了世界上最大的阿勒泰鐵隕石雨。在相當長的一段時期內,阿勒泰的記錄都是斷斷續續不完整的。
  • 世界上面積最大的塑料吸管海洋生物拼圖
    世界紀錄名稱: 浙江少兒頻道與杭州遠洋樂堤港聯合發起創作的塑料吸管海洋生物拼圖是世界上最大的塑料吸管海洋生物拼圖。世界紀錄初創者: 浙江少兒頻道與杭州遠洋樂堤港聯合發起創作的塑料吸管海洋生物拼圖。