「oncomine」——如何在大數據時代挖掘腫瘤數據

2021-01-14 解螺旋

  「大數據」時代已經降臨,在商業、經濟及其他領域中,決策將日益基於數據和分析而作出,而並非基於經驗和直覺。這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。

--by老談


  在生物學領域,大數據的整合分析更是亟不可待。到目前為止,在腫瘤方面已有oncomineTCGA這兩個資料庫,可供分析參考。


  先說TCGA,TCGA只提供數量有限的癌症基因表達譜,但是不能夠提供相關分析。其資料庫數據涉及到相關癌症基因的mRNA/microRNA表達譜、拷貝數變異、突變等大量的生物信息學數據。TCGA網絡中,數據類型包括拷貝數結果、雜合缺失、SNP等。

  

  另外,在搜索TCGA數據如何使用的過程中,相信小夥伴們會遇到level 1, level 2……等字眼。起始level 1 指的是原始數據;level 2指的是處理過的數據:經過標準化後的單樣本數據或對存在或者不存在特定分子異常的解釋;level 3指的是經過分割、解釋的數據:來自單個樣本的經過處理的數據的匯集;level 4 指的是感興趣的區域:基於兩個或多個數據的關聯,包含分子異常,樣本特徵,臨床變量。換句話說,也就是數據的權限,level 越高,數據可及性越低。



  Oncomine是目前世界上最大的癌基因晶片資料庫和整合數據挖掘平臺,旨在挖掘癌症基因信息。到目前為止,該資料庫已經收集了715個基因表達數據集,86733個癌症組織和正常組織的樣本數據。Oncomine擁有最全的癌症突變譜、基因表達數據以及相關的臨床信息,可利於發現新的生物標記物或新的治療靶點。


  Oncomine的使用並非免費的,廣大高校的小夥伴們可要好好的珍惜自己的學生身份,在校生可以通過學校的郵箱註冊使用,今天就先給大家介紹下這個資料庫的功能,有興趣的同學可以自行研究,下期也會詳細介紹使用流程。


  如下圖所示,oncomine整合了文獻及晶片資料庫中高質量標準的腫瘤組織晶片結果,14個注釋資料庫的分析,並且oncomine裡的數據會隨著這些數據可的跟新而及時跟新。通過oncomine網站(

www.oncomine.org)分析,可以得到差異表達的結果,共表達分析,富集分析,相互作用的網絡、及meta分析。



接上圖

老談雜談:


  通過oncomine,可以進行差異表達分析、共表達分析,查找某種癌症中差異表達的基因,確定目的基因,確定研究方向。對於研究方向還沒有確定的臨床醫生,如果想要通過晶片篩選確定感興趣的研究分子,可以通過oncomine數據挖掘的方法確定研究方向。不僅可以為您節省科研成本,而且其信息也更加全面。



點擊頁面左下角閱讀原文查看以下文章


 江洋小盜NF-kB進城記-47

 5-10分SCI文章入門-100

 你會寫標書麼?-108

 評審專家談國家自然科學基金上會評審情況-124

 IF:3-4分文章和5分文章的差距-127

 國自然敲門磚の表觀遺傳學-128

 醫學科研圈的裝逼指南——Bigger than bigger,豈止是裝!-136


相關焦點

  • 傳說中的Oncomine! 【基因數據挖掘專題第十三期】
    今天,我們要介紹一個全新的、大名鼎鼎的資料庫——Oncomine為了更加形象地幫大家理解這個詞,我們不妨解釋為Oncology Mining,顧名思義,就是挖掘腫瘤方面的生物學信息另外,據統計,該資料庫收集了約500種腫瘤的基因表達和樣本數據。意味著無論你是研究什麼方向,只要是腫瘤方面的,在這裡都能找到屬於你自己的菜。
  • Oncomine數據挖掘快速發文捷徑
    但是現在不一樣了,現在進入了數據大時代,特別是生物信息學方面的數據,資料庫越來越多,像GEO,TCGA,Oncomine。雖然專業搞生信都要會編程,當然GEO,TCGA也離不開編程,但是這裡有一個資料庫不用編程的,這個資料庫是Oncomine,差異表達分析,共表達分析,Outlier分析等等Oncomine自己都會分析,不用任何代碼,我們只要會點滑鼠就可以了。接下讓我們一起看一下到底是怎麼樣操作?
  • Oncomine:腫瘤晶片資料庫
    腫瘤作為人類健康的頭號殺手,其研究的重要性不言而喻。隨著晶片和NGS技術的發展,發表了很多的腫瘤相關數據。然而這些數據來自不同的組織和團隊,由於缺乏統一的數據管理和組織,這些數據在發表之後就沒有再利用了,為了提高數據利用率,促進腫瘤研究的發展,Oncomine的開發團隊收集了各種來源的腫瘤相關的晶片數據,用標準化的分析流程處理這些數據,數據分析的結果通過web服務查詢和可視化,對應的文章連結如下https://www.ncbi.nlm.nih.gov/pmc/articles
  • 腫瘤全面分析資料庫:oncomine使用介紹
    今天就給大家介紹一個匯總了多個癌種,多個數據集的綜合性分析基因表達和臨床相關性的資料庫:oncomine(https://www.oncomine.org/)。    由於這個資料庫還是很重要使用起來也是很簡單的,所以這裡就從註冊帳號開始,很詳細的介紹一下這個資料庫的功能吧。
  • Oncomine:癌基因晶片數據挖掘平臺系列介紹(一)
    這些晶片數據來源於美國 NCBI的Gene Expression Omnibus (GEO) 、EBI的ArrayExpress,斯坦福基因晶片資料庫( Stanford Microarray Database, SMD ), 癌症和腫瘤基因圖譜(TCGA)以及文獻。
  • AI時代,數據挖掘過時了嗎?—企業數據挖掘成功之道(理論篇)
    大數據時代、人工智慧時代,機器學習、人工智慧、深度學習、集成學習……概念漫天飛,數據挖掘似乎成為一個過時技術和概念。今天小編結合多年專業學習與研究經驗,從實踐應用的角度重新梳理一下「數據挖掘」,讓您能夠拋開概念了解本質!
  • 乾貨 面向大數據的時空數據挖掘
    第 1 部分早期的數據挖掘研究主要針對字符、數值型的商業數據,隨著信息技術的不斷提高以及行動裝置和網絡的廣泛使用,數據產生的速度越來越快,數據收集的頻率越來越高,數據密度的增長越來越顯著,這些因素都使得大數據問題成為一種必然的趨勢。而在大數據時代下很多商業數據都包含有時間和空間信息,比如設備,建築,機構等的管理,能量的產生,分布及預測等。
  • 文章著急發表數據卻不夠?找找這幾個網站吧,圖片直接拿來用!
    1、Oncomine網址:https://www.oncomine.org/resource/login.html應該是現在最方便的腫瘤數據挖掘平臺了,用學校郵箱註冊以後,按照自己的研究方向一頓選擇,就能產出一堆圖出來,關鍵還能直接放到文章裡。
  • 「沉睡」的醫療大數據該如何挖掘 專家:數據共享有三大阻礙
    來源/東方IC 大數據時代,研究表明,目前被利用的臨床數據只佔醫療總數據的10-20%,如何挖掘各醫療機構中沉睡的海量數據並深度利用,有著重要的理論意義和臨床實用價值。 新民晚報記者從一場線上論壇獲悉,位於長三角的之江實驗室建立了多中心智能醫學信息平臺,實現了一站式、跨機構、無障礙的多中心臨床數據深度利用。
  • 大數據_數據挖掘技術分類及應用
    大數據簡介   大數據(big data),指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。研究機構Gartner給出了這樣的定義。
  • 深入淺出:如何從0開始學習大數據挖掘分析?
    最近有很多人諮詢,想學習大數據,但不知道怎麼入手,從哪裡開始學習,需要學習哪些東西?對於一個初學者,學習大數據挖掘分析的思路邏輯是什麼?本文就梳理了如何從0開始學習大數據挖掘分析,學習的步驟思路,可以給大家一個學習的建議。
  • 大數據時代的大數據技術與應用有哪些.
    大數據給網際網路帶來的是空前的信息大爆炸,它不僅改變了網際網路的數據應用模式,還將深深影響著人們的生產生活。深處在大數據時代中的人們,已經認識到大數據已經將數據分析的認識從「向後分析」變成「向前分析」,改變了人們的思維模式,但同時大數據也向我們提出了數據採集、分析和使用等難題。
  • 大數據中數據挖掘的基本步驟
    導讀 數據挖掘基本步驟,數據挖掘過程定義問題、建立數據挖掘庫、分析數據、準備數據、建立模型、評價模型和實施。
  • 腫瘤基因組:TCGA數據挖掘之TCGAbiolinks
    我們知道TCGA計劃產生了30多種腫瘤的多組學數據,是腫瘤研究的寶庫。
  • 從公安大數據業務切入,挖掘更多數據價值:明略數據完成 2 億元 B...
    大數據概念在國內炒的過熱,落地大數據應用的產品並不多。原因一方面在於底層數據的非結構化存儲,數據挖掘技術難度大;另一方面在於數據挖掘多樣化模型建立的技術難度。從it時代到DT時代,大家都在談大數據概念而無法落地,而一旦系統應用到具體場景,完成大量非結構化的數據存儲和挖掘的工作,大數據領域可能是座金礦。
  • 腫瘤免疫浸潤分析工具匯總-數據挖掘新高度
    2018年腫瘤免都疫榮獲諾獎,成為一大熱點。
  • 美林數據助力大數據時代的軍工企業數位化變革
    美林大數據解決方案總監趙茅受邀出席會議,並發表了題為《大數據時代的軍工企業數位化變革》的主題演講。,趙茅以大數據時代軍工企業面臨的機遇與挑戰入手,闡述了軍工企業作為國家重要國防裝備的研發、生產與服務供應商,中國高端製造的代表,該如何在企業數位化變革進程中找準切入點,圍繞企業數據資產的集成管理、互聯互通、分析應用來挖掘數據價值,提升企業核心競爭力。
  • 大數據時代我國遊戲業如何借力(圖)
    僅在2013年,人們製造並使用的數據就達到1.8ZB,通過對海量數據的掌握和分析,既能為用戶提供更加專業化和個性化的服務,又能擴大對外服務,可謂一箭雙鵰。基於此,在第十二屆中國國際網絡文化博覽會期間,網絡文化高峰論壇也圍繞「網路遊戲與大數據」的話題,研究如何將大數據與遊戲行業緊密結合運用,為業界指引著方向、開拓著思路。
  • 大數據是什麼?大數據時代四個特點
    大數據是什麼?其實很簡單,大數據其實就是海量資料巨量資料,這些巨量資料來源於世界各地隨時產生的數據,在大數據時代,任何微小的數據都可能產生不可思議的價值。大數據有4個特點,為別為:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值),一般我們稱之為4V。
  • 大數據時代,數據分析師的報考條件是什麼?
    隨著網際網路的迅速發展,人已經進入大數據時代,在大數據時代,數據分析、數據挖掘工作面臨著機遇與挑戰,特別是近幾年,大數據已逐漸走進商業、政府、科研、教育、醫療等各行業。同時,也給商業、政府、科研、教育、醫療等各行業帶來了不小的危機感。