曙光生物基因序列研究解決方案

2020-11-23 太平洋電腦網

  

  摘要:       

  人類基因組研究已進入一個新時期,2003年4月14日正式發表了人類基因組全圖,到2006年初為止,GenBank中的DNA鹼基數目已達60億,DNA序列數目達到5千多萬。      

  如何分析這些基因數據,從中獲得生物結構、功能的相關信息是基因組研究取得成果的決定性步驟。基因組的研究也將全面進入信息提取和數據分析階段,即基因組信息學發揮重要作用的階段。      

  基因組信息學是生物信息學的核心。包括基因組信息的獲取、處理、存儲、分配和解釋。包括了兩層含義,一是對海量基因數據的收集、整理與服務;二是從數據中發現新的規律,也就是用好這些數據。      

  廣泛使用的基因序列比對和搜索軟體有Fasta ,Blast,以及多序列搜索工具Clustalw,Clustalx,這些基因組信息學軟體都已經在曙光伺服器上得到部署和應用,並有相應的成功案例。

  曙光公司助力生物信息學的發展,可為基因組信息學研究提供系統的解決方案,包括相應的硬體平臺和軟體配置。

  1.生物信息學和基因組信息學      

  生物信息學已成為整個生命科學發展的重要組成部分,成為生命科學研究的前沿。而基因組信息學是生物信息學的核心,生物信息學則以基因組信息學為基礎。  
   
基因組信息學包括了基因組信息的獲取、處理、存儲、分配和解釋。有兩層含義,一是對海量基因數據的收集、整理與服務;二是從數據中發現新的規律,也就是用好這些數據。      

  生物信息學是把基因組 DNA序列信息分析作為源頭,找到基因組序列中代表蛋白質和 RNA基因的編碼區;同時,闡明基因組中大量存在的非編碼區的信息實質,破譯隱藏在 DNA序列中的遺傳語言規律;在此基礎上,歸納、整理與基因組遺傳信息釋放及其調控相關的轉錄譜和蛋白質譜的數據,從而認識代謝、發育、分化、進化的規律。     

   生物信息學利用基因組中編碼區的信息進行蛋白質空間結構的模擬和蛋白質功能的預測,並將此類信息與生物體和生命過程的生理生化信息相結合,闡明其分子機理,最終進行蛋白質、核酸的分子設計、藥物設計和個體化的醫療保健設計。

  2.生物信息資料庫及其查詢      

  生物學中最重要的兩種物質有:DNA和蛋白質。DNA是一種由鹼基按一定規則排列而成的雙鏈結構生物大分子,這種鹼基排列順序就構成了生物的遺傳信息。蛋白質是由DNA根據鏈結構上的某些功能鹼基序列複製而成的具有特殊功能的生物大分子。生物基因包括DNA鏈上的鹼基及其排列順序。雖然鹼基的數目只有四種Adenine(A)、Cytosine(C)、Guanine(G)、Thymine(T),而它們在DNA上做各種有序的排列形成了生物的多樣性。所以對這種鹼基序列進行測序、編碼和研究是生物學研究最重要的工作。生物基因序列數據就是對於某一生物基因採用某種編碼方式編碼產生的數據。      

  近年來大量生物學實驗的數據積累,形成了當前數以百計的生物信息資料庫。它們各自按一定的目標收集和整理生物學實驗數據,並提供相關的數據查詢、數據處理的服務。隨著網際網路的普及,這些資料庫大多可以通過網絡來訪問,或者通過網絡下載。       

  這些生物信息資料庫可以分為一級資料庫和二級資料庫。一級資料庫的數據都直接來源於實驗獲得的原始數據,只經過簡單的歸類整理和注釋;二級資料庫是在一級資料庫、實驗數據和理論分析的基礎上針對特定目標衍生而來,是對生物學知識和信息的進一步整理。國際上著名的一級核酸資料庫有GenBank資料庫、EMBL核酸庫和DDBJ庫等;蛋白質序列資料庫有SWISS-PROT、PIR等;蛋白質結構庫有PDB等。國際上二級生物學資料庫非常多,它們因針對不同的研究內容和需要而各具特色,如人類基因組圖譜庫GDB、轉錄因子和結合位點庫TRANSFAC、蛋白質結構家族分類庫SCOP等等。

相關焦點

  • 曙光中標上海仁濟醫院!為基因測序平臺提供有力IT支撐
    近日,曙光中標上海交通大學醫學院附屬仁濟醫院(以下簡稱:仁濟醫院),為其搭建的心內科基因測序平臺提供IT支撐。曙光提供的存儲解決方案,有效解決了基因測序過程中存儲容量、性能和成本等問題,有力支持醫院實現高精度的測序數據分析。仁濟醫院是上海開埠後第一所西醫醫院,也是一個綜合性三級甲等醫院。
  • 曙光高性能計算解決方案:物理化學領域
    在物理和化學學科中,隨著理論計算方法的發展和成熟,以及計算機軟、硬體技術的不斷進步,計算機模擬研究漸趨普及,已成為繼實驗手段、理論推導之後的第三類重要的科研方法。相應領域的計算機模擬研究也逐漸形成獨立的學科,比如計算化學、計算材料學等。
  • 曙光與華大基因推出國內首臺生物專用計算機
    南方網訊 日前,曙光公司與國內著名的基因組、生物信息研究中心華大基因聯合推出國內首例生物信息專用計算機,填補了我國在生物信息領域沒有專用機的空白。有關專家介紹說,該產品將被應用在我國的生物信息研究領域,主要針對生物、醫藥、農業等領域,進行快捷的基因組測序查找、藥物研發等。
  • 基因敲除構巢麴黴的研究-源井生物
    由於用Cas9編輯的基因受到其5&39;原間隔子相鄰基序(PAM)序列的限制,因此重要的是,引入依賴於其他PAM序列的RNA指導的核酸酶以靶向更大的基因組位點。基因敲除大腸桿菌的Cpf1使用由5&39;組成的PAM序列,因此實現此目標是一個有吸引力的選擇。在這項研究中,針對構巢麴黴優化的Lb_cpf1密碼子可用於絲狀真菌中基於CRISPR的基因編輯。
  • 《PLoS綜合》:科學家發現奇異基因序列或來自全新生物域
  • 昆明植物所完成六種木本竹子葉綠體基因組全序列的測定
    木本竹子因種類數目多,形態性狀複雜多變及多年生一次性開花等原因而成為系統發育學研究難點。隨著新一代測序技術的興起,系統發育基因組學為解決這類困難類群的系統發育關係帶來了曙光。中國科學院昆明植物研究所李德銖研究組對木本竹子的研究有較好的研究基礎。最近,該研究組選取1種熱帶竹子和5種溫帶竹子,利用新一代測序技術Illumina測定了這些種的葉綠體基因組全序列。
  • 章魚的基因序列和地球生物截然不同,難道真是外星人!
    據香港《明報》網站8月14日報導,這項研究由諾貝爾獎得主、日本衝繩科學技術大學院大學(OIST)教授布倫納(Sydney Brenner)發起,對常見的加州雙斑蛸(California two-spot octopus)90基因組作排序和註釋。研究結果發表在最新一期《自然》期刊上。
  • ​研華攜手偉薩科技,發布一體化DNA基因排序加速解決方案
    近日,研華科技宣布發布與偉薩科技技術共同創建的DNA基因排序加速解決方案。
  • 大數據應用:基因序列分析
    創業團隊的平均學識無人能出其右,均是來自史丹福大學與加州大學伯克利分校的博士,研究方向為大數據或生物信息。沒錯,Bina Technology 的目標就是把生命科學與計算機科學融合起來。  Bina Technology 主營業務是採用大數據的分析方法分析人類基因序列,他們的分析所得將成為研究機構、臨床醫師等下遊醫療服務行業的基礎素材。
  • 基因編輯幹細胞基因編輯技術-源井生物
    為了生成健康的患者源細胞,一種基於短回文重複序列(CRISPR)/Cas9的細菌系統(簇狀分布)的基因編輯技術可用於修復突變,從而產生不需要患者免疫抑制的新型植物。儘管該基因具有重複序列和富含GC的序列,但RPGR基因拷貝中有13%顯示出基因突變糾正和轉化為野生型等位基因。這是首次使用CRISPR糾正患有感光細胞變性患者的iPSC中的致病突變。這一重要的概念驗證發現支持針對視網膜疾病的個性化基於iPSC的移植治療的發展。
  • 中科曙光"先進計算"全面應對"精準醫療"
    「精準醫療」是一個依據個體基因差異、個人生活方式不同和環境因素不同的一個名詞,在一個個精準數據的指導下,對疾病設定了一個預防和治療的新方向,簡單通俗的說就是通過已經知道的基因信息
  • 基因庫新時代的曙光
    由萊布尼茨植物遺傳和作物研究所(IPK Gatersleben)領導並由德國生物多樣性綜合研究中心(iDiv)支持的一個國際研究聯盟現在已經從分子水平上描述了來自世界各地包括22000個以上大麥品種的種子樣品集合。在《自然遺傳學》雜誌上發表的一項研究中,科學家們為基因庫開闢了一個新時代,基因庫從過去的作物多樣性博物館轉變成生物數字資源中心。
  • 降解樣本、大基因組等非模式生物的解決方案
    2020年Anna等人在Molecular Ecology Resources雜誌發表一篇名為「Helping decision making for reliable and cost-effective 2b-RAD sequencing and genotyping analyses in non-model species」的文章,為2b-RAD在非模式生物中的可靠和高性價比研究提供了指導方案
  • 華為雲攜手峰科發布FPGA基因加速雲解決方案,基因測序性能提升5倍
    近期,華為雲攜手峰科計算(以下簡稱「峰科」)發布基於FPGA的基因加速雲解決方案,該方案採用GATK(The Genome Analysis Toolkit)標準分析流程,將全基因組測序(WGS)性能提升5倍,比傳統模式提升3~5倍,同時測序精度可達99.95%以上,在大幅縮短測序時間的同時實現TCO大幅降低。
  • 【乾貨】生物信息學基礎-如何向NCBI-GenBank提交基因序列
    生物信息學是當前生物醫學領域的熱門研究方向,其理論知識和方法學已經滲透到各個領域。
  • 基因編輯放大招:改變基因序列,提高兩大難治性癌症生存率
    據《科學進展》雜誌日前報導,以色列特拉維夫大學的一項研究裡,研究人員開發一種基於脂質納米顆粒的新型基因編輯法,其通過基因編輯操作將癌細胞破壞,從而使癌細胞失效並防止永久複製。研究結果顯示:CRISPR/Cas9基因編輯法用於治療侵入性癌症效果非常顯著,人類離治癒癌症又跨進了一大步。
  • 【你知道嗎】章魚最具外星範兒:基因序列和地球生物不同
    科學家最近已經證明,至少在基因上,章魚還真有點兒外星人的範兒。章魚基因計劃(Octopus Genome Project)是一個野心勃勃的龐大研究項目,旨在繪出章魚這種複雜軟體動物的 DNA 結構。芝加哥大學和衝繩科學技術大學院大學的科學家們主導這一計劃,而且有了驚人發現:章魚的基因序列和地球上的其他生物太不一樣了。
  • 基因編輯放大招:改變基因序列,提高兩大難治性癌症生存率
    ,研究人員開發一種基於脂質納米顆粒的新型基因編輯法,其通過基因編輯操作將癌細胞破壞,從而使癌細胞失效並防止永久複製。  研究結果顯示:CRISPR/Cas9基因編輯法用於治療侵入性癌症效果非常顯著,人類離治癒癌症又跨進了一大步。
  • 史上最大生物學研究項目公布:10年內,測定150萬種真核生物基因組序列
    4月24日,《美國科學院院刊》(PNAS)發表文章,正式公布地球生物基因組計劃(Earth BioGenome Project)的細節。這標誌著這項史上規模最大、最具雄心的生命科學項目即將拉開帷幕。該項目計劃耗資47億美元,在接下來的十年間,測出所有已知的150萬種真核生物的基因組序列,並為我們找到尚未發現的全新物種。
  • Crispr技術基因敲除細菌-源井生物
    具有間隔序列的RNA可以幫助Cas蛋白識別和切割外源DNA。 RNA引導的其他Cas蛋白可以切割外源RNA。在大約40%的細菌基因組序列和90%的古細菌序列中發現CRISPR。通過CRISPR-Cas9系統在基因敲除大腸桿菌中進行多次基因編輯工業上有用的微生物的構建需要有效的基因組規模的編輯工具。