下一代生物信息學工具無需編程專業知識即可進行大數據分析

2020-09-25 MedPeer

休斯頓-由德克薩斯大學MD安德森癌症中心的研究人員開發的一種新的數據分析工具,結合了用戶友好的自然語言界面,使沒有專門從事生物信息學或程式語言專業知識的生物醫學研究人員可以對大型數據集進行直觀分析。

創建開放式,人工智慧(AI)驅動的程序DrBioRight的目的是降低所有研究人員充分利用現代研究方法中產生的越來越大量數據的障礙。該平臺的報告今天在《癌細胞》中發表。

「我們認為,我們可以通過創建一種任何研究人員都可以使用的工具,來改進當前進行常規生物信息學分析的模型,並大大縮短周轉時間,」生物信息學和計算生物學教授韓亮博士說。「我們對DrBioRight的長期目標是成為每個研究人員的明智合作者。」

現代生物醫學研究中使用的高通量技術會生成大型,複雜的數據集,這些數據集可提供有關正在研究的患者,動物模型或細胞系的全面信息。這些可能包括,例如,研究整個遺傳信息(基因組學),基因表達(轉錄組學)或蛋白質表達(蛋白質組學)。

梁解釋說,由於這些「組學」數據集是如此複雜,因此在沒有專門的分析方法的情況下回答特定的生物學問題可能具有挑戰性。這些分析通常通過使用以多種程式語言編寫的計算機腳本來完成,這需要對編程和生物信息學都有一定的了解。

生物信息學家可以幫助導航和處理這些複雜的數據集,但是工作可能很耗時。因此,研究團隊開發了DrBioRight,使研究人員可以通過具有自然語言交互作用的用戶友好的聊天界面,更輕鬆地對自己的數據進行常規分析。

Liang解釋說,面向自然語言的程序允許用戶像自然說話一樣提問程序問題,而不是使用複雜的程式語言。

DrBioRight免費提供給學術研究人員。最初,該程序具有許多模塊,可以處理最常見的生物信息學問題類型,並且包括一些最常用的公共癌症數據集,例如The Cancer Genome Atlas和Cancer Cell Line Encyclopedia。

作為對該方法的證實,研究人員使用DrBioRight複製了經典癌症基因組學論文的分析,發現該論文能夠準確地再現以前發表的結果。

由於該程序是由AI驅動的,因此它還具有從每次查詢中學習並改進分析的能力,隨著時間的推移,它變得更加有用。展望未來,研究人員希望改進DrBioRight,以使用戶能夠分析自己的數據集並允許對新模塊進行開放式開發。

「在努力改善程序的同時,我們還希望其他生物信息學家能夠貢獻他們的算法並教授DrBioRight,」 Liang說。「整個研究界的參與將有助於創建一種工具,有助於更有效地回答覆雜的研究問題。」

相關焦點

  • 國家微生物科學數據中心推出免費一站式生物信息分析雲平臺
    產生了大量的微生物組學數據,想進行數據分析不知道使用什麼工具?不會使用Linux系統?不會寫代碼?沒有合適的參考資料庫?計算資源不足?現在這些問題都可以通過國家微生物數據中心推出的一站式生物信息分析雲平臺解決。
  • CIO時代APP微講座:青島大學李勁華——大數據與生物信息學的應用...
    基於cDNA序列測試所建立起來的EST資料庫已超過數百萬條,在這些數據基礎上派生、整理出來的資料庫已達5000多個。  這一切構成了一個生物學數據的海洋。這種科學數據的極速和海量積累在科學發展史上是空前的,但數據並不等於信息和知識,當然,它是信息和知識的源泉,關鍵在於如何從中對其進行挖掘。與正在以指數方式增長的生物學數據相比,人類相關知識的增長卻十分緩慢。
  • 大數據信息分析的方法與工具
    那麼大數據給我們帶來了什麼好處呢?大數據最大的好處在於能夠讓我們從這些數據中分析出很多智能的、深入的、有價值的信息。   1、信息分析的原理   信息分析主要以事物、現象、數據、信息的屬性、特徵、本質、規律、關聯等為依據展開定性和定量分析,以期發現新知識。
  • Cancer Cell|時代新範式-下一代組學分析智慧機器人
    為了回應這一挑戰,生物信息科學家們在簡化生物醫學數據分析流程上付出了諸多努力,開發出了各類適應於本地運行的高度封裝化的端對端的生物醫學數據分析工具和基於網頁操作的數據可視化及分析平臺。對於缺乏數據科學專業訓練的以實驗技術為主導的研究者個人或課題組來說,如何更便捷、更高效地通過對現有大規模數據進行挖掘和分析來設計課題、產生假說、驗證結論,是一個關係到科研生產力整體發展的重要話題。前述提到的普及化分析工具和平臺往往在分析模態的多樣性和靈活性上有諸多限制,並且對實驗生物學研究者仍然提出了掌握各類常規操作模塊或分析界面的技術性要求。
  • 大數據時代下的生物信息學研討會舉行
    12月2日,由我校醫學生物信息學研究所主辦的「河南大學博士後學術論壇—表觀遺傳與癌症論壇暨大數據時代下的生物信息學研討會」在基礎醫學院舉行。大會邀請了表觀遺傳和生物信息學領域的多名專家學者。會議由黃河學者郭向前教授主持。
  • 如何從零開始掌握生物信息學分析(新手寶典)
  • 生物信息學專業十強
    生物信息學(Bioinformatics)是一門交叉科學,它包含了生物信息的獲取、加工、存儲、分配、分析、解釋等在內的所有方面,它綜合運用數學、計算機科學和生物學的各種工具,來闡明和理解大量生物數據所包含的生物學意義。
  • 生物信息學為大數據 「插上翅膀」
    圖為陳潤生院士正在做報告「如今,生物信息學正扮演著越來越重要的角色,它也是資訊時代帶給生物醫學的巨大推動力。」8月3日,在第十四屆國際生物信息學論壇(IBW 2019)上,哈佛大學教授劉小樂表示,生物醫藥領域產生了海量的數據,如何通過生物信息學與計算科學弄懂這些數據,成為生命科學領域專家共同關注的話題之一。
  • 大數據專業學什麼?未來好就業嗎
    從IT時代轉向DT時代,一個典型的轉變就是,數據開始得到更高程度的重視,數據驅動策略,成為企業的普遍共識。而在這樣的大趨勢下,2016年國內高校開始設立大數據專業,培養大數據人才。那麼大數據專業學什麼?未來好就業嗎?今天我們來具體聊一聊。
  • 數學不好、英語不好、非本專業,想學Python數據分析,能安排嗎?
    有不少小夥伴問我,我想學Python數據分析,但是數學不好,英語也不好,還不是計算機專業的,能安排嗎?我的答案是,能。我想提幾點初學者常犯的思維誤區,正是這些誤區在阻礙我們去嘗試新事物。誤區一:學習python數據分析需要很強的數理基礎這個想法『部分正確』。
  • 生物信息學專業:生物+計算機(高考家長每日必讀),No.85
    學什麼呢:最核心課程三大部分:生物學、數學、計算機科學課程有:生物化學、分子生物學、概率統計、數據結構及實驗、基因組信息學、轉錄組信息學、蛋白質組信息學、計算機輔助藥物發現、現代統計與生物信息學。面對生物數據大量膨脹,而分子實驗效率無法有效提升,通量無法繼續提高的情況下,只有利用高性能計算機對測序等產生的大數據進行統計學等數學方法分析,結合已有的分子基礎,才能更系統更全面的探索生命活動過程。也就是現在比較火的系統生物學(System Biology)。
  • 12個頂級大數據工具 - 大數據_CIO時代網 - CIO時代—新技術、新...
    而在這些工具中選擇是一個挑戰,特別是許多大數據工具只具有單一用途,而企業需要使用大數據完成許多不同的任務,因此企業的分析工具箱會變得過於充實。根據這個行業領域的專家顧問的建議,以下列出一系列主要的大數據分析工具,並列出三個主要類別。
  • 數據統計分析軟體的理想工具:Stata
    儘管您無需編寫程序即可使用Stata,但令人欣慰的是,快速而完整的程式語言是Stata不可或缺的一部分。Mata既是用於處理矩陣的交互式環境,又是可以生成經過編譯和優化的代碼的完整開發環境。它包括用於處理面板數據的特殊功能,可以在真實或複雜矩陣上執行操作,為面向對象的編程提供完全支持,並且與Stata的各個方面完全集成。
  • 信息學競賽需要掌握哪些程式語言知識
    信息學競賽現在已經受到越來越多的人的關注,怎麼走進信息學競賽的大門呢?一、程式語言選擇信息學聯賽主要考的是程序設計,選擇合適的參賽程式語言是首要選擇,信息學競賽的程式語言有三種:pascal語言、c語言、c++語言,pascal語言將於2022年停止在信息學競賽中使用,所以現在學習pascal語言意義不大,剩下的只有選擇c語言和c++語言,實際考試中絕大多數考生選擇
  • 熱門計算機專業學什麼?
    計算機科學是一門包含各種各樣與計算和信息處理相關主題的系統學科,從抽象的算法分析、形式化語法等等,到更具體的主題如程式語言、程序設計、軟體和硬體等。算法 數字系統設計 作業系統 軟體工程 編譯工具 資料庫設計原理 計算機製圖 機器人學 …
  • 數據分析工具太多該怎麼選擇合適的軟體?
    一般在日常生活中大家用到的數據分析工具多數是excel。但是其實在數據分析工具中,excel只是基礎。對於那些專門做數據分析的人來說,有更為簡便、專業的數據分析工具。
  • 植物科學常用資料庫和生物信息學工具
    在所有開展植物科學相關研究的科研工作者的日常中,無法避免會使用到各類資料庫和分析平臺。這些資料庫和分析平臺的建立和更新維護為植物的組學、功能、進化以及遺傳育種等方面研究提供了豐富的資源。以下是一些植物科學常用的資料庫和生物信息學工具,分享給大家,希望對大家有用。
  • 下一代教育裡,編程可能跟英語一樣重要
    不論是美國在線編程教育網站 code.org 發起的「編程一小時」活動,還是教育部召開新聞發布會,宣布在此次「新課標」改革中,正式將人工智慧、物聯網、大數據處理劃入新課標的新聞,都有相同的中心思想:下一代教育裡,編程可能跟英語一樣重要。少兒編程教育源起於何時?現在又發展到了哪一步?國內的行業現狀又是如何?
  • 生物信息學相關網站
    生物信息學專業網:http://bioinf.bmi.ac.cn/      生物信息學專業網旨在收集、整理與生物信息學相關的信息和資源。它的站點提供最近新聞;與生物科學相關的論文;與生物信息學相關的資料庫,軟體,公司,大學和期刊;工具的介紹,例如:序列逆向查詢系統。
  • 9文聚焦:宏基因組學與微生物組分析方法和工具
    ,宏基因組學,菌株水平,絕對豐度,分析方法和工具,注釋,噬菌體。、樣本量計算方法以及提高研究可靠性的方法;④ 討論了微生物組研究中常用的統計分析方法,重點關注多重比較的問題以及組間β多樣性分析的方法;⑤ 最後,文章介紹了生物信息學分析的具體流程。