基因組所生物信息高性能計算機投入使用

2020-12-04 中國科學院

隨著中科院北京基因組研究所第二代測序儀陸續投入使用,海量的數據日益產出,原有基因組所的計算能力和數據存儲能力已經遠遠不能滿足新的需求,為此,2008年10月基因組所啟動了採購計劃。2009年2月下旬,基因組所生物信息高性能計算機到位,經過緊張的安裝調試,已正式投入使用。這次選用的浪潮伺服器,屬於國產自主品牌高性能計算系統,其運算分析能力達到每秒10萬億次,數據存儲能力達到400TB,隨著高性能計算系統的投入使用,加之2008年,3臺SOLiDTM系統基因分析儀的安裝運行,基因組所在硬體環境系統實施了更新換代,全力搭建的基因組測序和生物信息處理平臺初步完成。

2月6日,隨著大型計算機的到位,基因組所的工作人員開始緊鑼密鼓的設計與安裝系統,初步完成了計算集群硬體和軟體的安裝,目前已經進入整個系統測試和調優階段,該大型計算機計劃在2月底將全部投入使用。此次到位的高性能集群式伺服器主要採用了浪潮的刀片伺服器以及存儲,分為計算節點和存儲節點兩部分:計算部分採用12臺刀片中心,配置了112片刀片,每顆刀片配置了兩顆2.83G Intel Xeon 5440 CPU,有92片配置了16GB 內存,20片配置了32GB內存並配置了infiniband 高速交換網絡,總體的運算速度達到10萬億次/秒。存儲部分採用9套48 TB的盤陣,達到432 TB的總容量,滿足海量生物數據存儲的需求。網絡部分集中了萬兆、千兆、Infiniband、FC等多種網絡環境搭建而成。系統將集群監控軟體、生物信息軟體、資料庫等集成,構成高性能生物信息專用集群系統。

2008年引進的SOLiDTM (Sequencing by Oligonucleotide Ligation and Detection)的高通量測序系統。其每輪運行可以產生超過30億鹼基(相當於一個人類基因組全序列)的可定位數據。可對多種菌株進行極高覆蓋度的測序分析;能夠對包括特殊疾病或者藥物表型等在內的完整基因進行精確的序列分析;也能用於高通量的基因表達研究,而其成本和時間消耗大大低於傳統測序技術。特別是在開展靶基因重測序研究、基因表達分析、MicroRNA(非編碼小分子RNA)的發現、染色質免疫共沉澱研究以及其它物種全基因組序列測定等相關研究方面將給予強大的支持。

目前,基因組所的高通量測序儀和高性能生物信息處理計算機已經被列入北京生命科學大型儀器共享系統,實施平臺資源共享。

        

相關焦點

  • 沒有超級計算機,也敢玩高性能計算?
    集群式的高性能計算機使用相對便宜的聯網計算機,運行現成的軟體,通常更易於部署和運行。儘管如此,對於大多數企業來說,特別是那些高性能計算需求有限的企業,即使是規模不大的集群型高性能計算也是很大的投資。現在,這種情況正在改變。希望在不突破IT預算的情況下使用高性能計算的企業可以選擇轉向公有雲服務,例如,谷歌雲、微軟Azure、亞馬遜網絡服務(AWS)和IBM雲等。
  • 生物信息學專業:生物+計算機(高考家長每日必讀),No.85
    學什麼呢:最核心課程三大部分:生物學、數學、計算機科學課程有:生物化學、分子生物學、概率統計、數據結構及實驗、基因組信息學、轉錄組信息學、蛋白質組信息學、計算機輔助藥物發現、現代統計與生物信息學。報考建議:生物信息學專業比生物科學、生物技術好的地方就是學了計算機相關課程,所以就業能去現在比較火的IT行業。但問題是,如果你想去IT行業就業,那直接學計算機不更好嘛。
  • 曙光與華大基因推出國內首臺生物專用計算機
    南方網訊 日前,曙光公司與國內著名的基因組、生物信息研究中心華大基因聯合推出國內首例生物信息專用計算機,填補了我國在生物信息領域沒有專用機的空白。有關專家介紹說,該產品將被應用在我國的生物信息研究領域,主要針對生物、醫藥、農業等領域,進行快捷的基因組測序查找、藥物研發等。
  • 基因組所《基因組蛋白質組與生物信息學報》影響因子顯著提高
    在日前舉行的第四屆中國英文版科技期刊研討會上,中國科學技術信息研究所發布了「2007年版中國英文版科技期刊引證報告」。根據這一報告提供的數據,中科院北京基因組研究所主辦的《基因組蛋白質組與生物信息學報》(Genomics, Proteomics & Bioinformatics,簡稱GPB)的影響因子大幅提高,2006年影響因子為0.239,比2005年的0.131提高了82.4%。
  • 北京基因組所等密碼子偏好性研究獲進展
    在遺傳信息編碼過程中,編碼同一種胺基酸的多個同義密碼子(Synonymous Codons)的使用頻率並不相等,這種現象稱為密碼子使用偏好(Codon Usage Bias,大量研究證實,在同一物種內,高表達水平的基因由於需要提高翻譯準確性及效率而傾向於使用最優密碼子,因此表現出高的密碼子使用偏好性。  翻譯選擇的研究主要集中在原核生物以及單細胞真核生物(例如大腸桿菌、酵母)。人的基因組結構極為複雜,使得關於翻譯選擇的相關研究變得非常困難,甚至無法確切判斷是否有翻譯選擇存在。
  • 2018《基因組蛋白質組與生物信息學報》編輯部招聘公告【招1人】
    《基因組蛋白質組與生物信息學報》(Genomics, Proteomics & Bioinformatics,GPB)是由中國科學院北京基因組研究所和中國遺傳學會共同主辦的英文科技期刊,2003年創刊;被DOAJ、PubMed/MEDLINE、PubMed Central、SCIE、Scopus等資料庫收錄。
  • 基因組所方向東研究組招聘生物信息學博士後啟事
    本研究組研究方向為:(1)幹細胞和腫瘤領域基因調控網絡關聯的分子機制;(2)生物大數據整合和挖掘分析。課題組詳細介紹參考:  http://sourcedb.big.cas.cn/zw/zjrc/YJSDS/201311/t20131116_3979427.html  招聘崗位:博士後  招聘人數:1~2名  工作地點:北京  一、職位要求:  1.具有(或即將具有)生物信息學、基因組學、計算機學、遺傳學等相關專業博士學位
  • 生物信息分析系統 ≠ 硬體+軟體堆砌
    如果上述問題還在佔用您的時間和精力,說明您的生物信息分析系統亟待更新完善。一個好的生物信息分析系統,可以解放您的雙手,您只需專注科學研究,其他問題交由生物信息分析系統來做。生物信息分析系統並不是簡單的硬體存儲加上分析軟體的堆疊,而是為滿足生物信息分析對於速度、規模和智能化等苛刻需求建立的一體化解決方案。
  • 這裡有10G的生物信息學中個層次的分析技術匯總
    生物信息學(Bioinformatics)是研究生物信息的採集、處理、存儲、傳播,分析和解釋等各方面的學科,也是隨著生命科學和計算機科學的迅速發展,生命科學和計算機科學相結合形成的一門新學科。它通過綜合利用生物學,計算機科學和信息技術揭示大量而複雜的生物數據所賦有的生物學奧秘。
  • 生物信息學相關網站
    用於比較基因組學的生物信息學工具:http://pga.lbl.gov/Workshop/webTools.html      用於比較基因組學的生物信息學工具是勞倫斯伯克利國家實驗室提供的用於比較基因組學的生物信息學的軟體、資料庫和網址資源。其涵蓋五個大類分別是:基因組數據、注釋、比較基因組、陣列資源、雜集。
  • 【中國科學報】《基因組蛋白質組與生物信息學報》:聚焦組學「三國...
    該刊由領域內一群熱情的、傑出的科研工作者運行,在組學和生物信息學研究領域的出版獲得了國際認可。」 諾貝爾獎得主、擔任GPB編委的託馬斯·林達爾曾如此評價。  在GPB創刊人兼主編、中國科學院北京基因組研究所(國家生物信息中心)(以下簡稱基因組所)研究員於軍看來,如果沒有始終如一的堅持,GPB就不會有今天的局面,甚至可能難以生存下來。
  • 基因組蛋白質組與生物信息學報首批在線預發表文章上線
    近日,由中國科學院北京基因組研究所主辦的全英文學術期刊——《基因組蛋白質組與生物信息學報》(Genomics, Proteomics & Bioinformatics, GPB),首批在線預發表(Article-in-Press)文章成功上線。
  • 信息科學引領未來生物醫學研究
    文章指出,隨著新技術的不斷出現,現代生物醫學的發展持續加速,由於所有生命系統基本上都受其自身DNA中信息的支配,因此信息科學對生物醫學的研究具有特別重要的意義。數據科學和人工智慧將在未來的精密醫學中起主導作用。
  • 英特爾、聯想攜手華大基因 利用超算加速新冠病毒基因組分析
    DoNews 3月3日消息(記者 向密) 英特爾、聯想及華大基因宣布,三家公司正攜手加快COVID-19新型冠狀病毒的基因組特性分析。據悉,來自英特爾及聯想的專業技術與生命科學專家將通力合作,為華大基因的研究人員提供全新的大數據分析技術和計算資源,提升其基因測序工具的分析能力,更高效地研究新型冠狀病毒的基因組特性。根據介紹,英特爾和聯想攜手為華大基因提供的技術包括一個大型高性能計算集群,可用於處理從華大DNBSEQ-T7測序系統讀取的高通量數據。
  • 中科曙光新一代矽立方高性能計算機亮相全球超算大會
    新華社美國達拉斯11月13日電(記者 周舟)正在美國達拉斯舉行的全球超級計算機大會上,浸泡在突突冒泡的恆壓液體中「衝涼」的中央處理器和圖形處理器仍能正常通電運行,吸引了大量參會者圍觀。這是中國高性能計算機企業中科曙光13日展示的新一代矽立方高性能計算機。
  • 海航籤派員信息管理系統於日前正式投入使用
    近期,記者從海南航空了解到,海航DIMS籤派員信息管理系統(DISPATCHER INFORMATION MANAGEMENT SYSTEM)於日前正式投入使用。該系統經半年多時間研發而成,實現計算機系統管理籤派人員的資格、訓練、值勤時間及排班等。該系統對建立職業化的籤派隊伍、搭建海航數位化管理平臺具有重要意義。
  • 國家基因庫投入運營:全球最大,採用阿里雲技術
    9月22日,位於深圳大鵬新區的中國首個、全球第四個國家級基因庫正式投入運營。國家基因庫是全世界最大的綜合性基因庫,1期建成後,綜合能力世界第一。這裡既有保存動植物、微生物和人類組織細胞等樣本的「溼庫」,也有匯集各種生物信息的「幹庫」——數據中心。
  • 昆明植物所利用基因組揭示板藍靛藍生物合成的遺傳基礎
    解析indigo物質生物合成的遺傳基礎,對高效利用板藍具有重要指導意義。近期,昆明植物所民族植物學團隊研究員王雨華課題組和木本資源發掘與農林複合系統構建團隊研究員劉愛忠課題組合作,開展了板藍的精細基因組測序研究並揭示靛藍生物合成的分子機制。研究人員結合MinION單分子測序和Hi-C測序技術,首次獲得了板藍染色體水平的精細基因組(圖1c,板藍基因組網站)。
  • 中國完成家蠶基因組"框架圖"[組圖]
    東方網11月15日消息:我國科學家15日宣布:經過400多名科研人員5個多月的艱苦努力,我國已率先完成家蠶基因組「框架圖」繪製工作。根據計算機組裝和數據分析結果表明,基因組測序完成了6倍的覆蓋深度,所獲序列覆蓋了家蠶基因組的95.54%,精確度達到了99.95%,完全達到了高質量工作「框架圖」的要求。
  • ...信息學,基因晶片相關信息學技術,藥物基因組信息學和系統生物學
    職稱: 教授       招生專業: 計算機應用技術 研究領域: 複雜疾病基因連鎖定位作圖方法, 生物醫學信息學,基因晶片相關信息學技術,藥物基因組信息學和系統生物學