微生物組-擴增子16S分析和可視化(線上/線下同時開課,2021.4)

2021-02-28 生信寶典

福利公告:為了響應學員的學習需求,經過易生信培訓團隊的討論籌備,現決定安排擴增子16S分析、宏基因組、轉錄組的線上/線下同時開課。報名參加線上直播課的老師可在1年內選擇參加同課程的一次線下課 。期待和大家的線上線下會晤。

目前可以通報的信息:


在廣大粉絲的期待下,《生信寶典》聯合《宏基因組》在北京於2021-4-9到 2021-4-11推出《擴增子16S分析》專題培訓第11期(線上課和線下課程同步開通),為大家提供一條走進生信大門的捷徑、為同行提供一個擴增子分析實戰學習和交流的機會、助力學員真正理解分析原理和完成實戰分析,獨創四段式教學(3天集中授課+自行練習2周+集中講解答疑+上課視頻回看反覆練習),「教—練—答—用」四個環節統一協調,真正實現獨立分析大數據

關於學習生物信息學分析的重要性,請閱讀《生物信息9天速成班—成為團隊中不可或缺的人》。

課程簡介

宏基因組/微生物組是當今世界科研最熱門的研究領域之一,為加強本領域的技術交流與傳播,推動中國微生物組計劃發展,中科院青年科研人員創立「宏基因組」公眾號,目標為打造本領域純乾貨技術及思想交流平臺。成立兩年,分享專業技術原創文章2400+篇,關注人數11萬+,累計閱讀量18,000,000+。

請詳細閱讀課程簡介,如果以下內容您全精通,不必參加此培訓。

本課程一共3天,每天6節課,共18節課,全部課程均理論與實戰結合(只要課上講的內容,都是要帶你親自實現的分析)。從分析平臺搭建、Linux和R基礎、圖表解讀和繪圖實戰、擴增子分析標準流程、功能預測、差異統計分析以及各類高級分析(進化樹、網絡、環境因子、隨機森林、Adaboost和來源追溯等),和CNS級圖片編輯和排版。3天時間,老司機帶您完成自學需要3個月甚至是3年的崎嶇之路,助力您真正玩轉擴增子分析。

課程大綱

每節課1小時一個主題,理論結合實戰,學懂原理,實戰操作,全是老司機多年經驗和代碼的無私分享。下面是課程安排,如11代表第一天第一節課,26代表第二天第六節課,41為兩周後的線上集中視頻答疑。

教程內容簡介如下:

一、生信基礎知識和技巧

還在為沒有Linux伺服器而無法分析擴增子數據而苦惱嗎?其實你的個人電腦就是擴增子分析的利器。易生信團隊獨創實現了跨平臺的分析流程,在大家的Windows筆記本上可以輕鬆實現擴增子領域的絕大多數分析,第一節課帶你輕鬆在自己的本本上搭建數據分析平臺。

圖1. 易生信首創基於Win10優化的擴增子分析流程,筆記本秒變大數據分析平臺

推薦使用Windows10系統,8G及以上內存分析更流暢。 我們也會分享給大家在Linux上配置整個分析流程的代碼 (Mac跟Linux類似,無須區別對待,但部分軟體可能安裝方式不同,未做深入測試,不建議參加培訓時使用)。

同時講解生物學家必要掌握的Shell和R語言基礎知識,保證你高效、穩定的使用擴增子分析平臺。

圖2. Shell和R學習大綱,首創Rstuio中滑鼠點擊可完成Shell腳本和R語言分析,既打開生信的大門,又不會增加生物學家時間成本

二、圖表解讀和繪製

針對很多老師缺少系統的生信背景,看不懂分析文章圖表,更對繪製各式圖表手足無措。

我們推出過如下兩個系列,共16篇原創文章,對8種圖形進行講解和R語言繪圖。

但這些只是入門,在培訓上,我們將結合發表高水平文章,進一步講解16種常用分析圖型結果的原理和使用範圍,讓您不僅讀懂圖,更知道如何應用於自己的研究,並親自輕鬆完成繪圖。

針對大家使用R語言繪圖學習時間成本較高的問題,易生團隊針對常用16種圖開發了免費繪圖網站,一鍵出圖,更可滑鼠點選參數修改圖形的個性樣式。

圖3. 16種常用圖形的繪製。可使用我們的在線繪圖工具實現。

為了讓各種統計圖片實現出版級的組圖,特開設了一節Adobe Illustrator修圖排版課,講述基本使用技巧,輕鬆掌握精髓,讓你文章圖版檔次向CNS看齊,輕鬆成為實驗室的修圖和拼圖達人。

圖4. AI排版本子圖為CNS出版級組圖示例(Science, 2016封面文章)

三、擴增子基礎和分析流程

圖5. 典型的擴增子結構模型圖

背景:國際微生物組(人類HMP、環境EMP)計劃、中國微生物組計劃

研究對象:人、動物、植物、環境

研究方法:培養組學、擴增子測序 (最常用)、宏基因組、宏轉錄組、宏蛋白組、宏代謝組、宏表觀組等

宏基因組學的研究熱點:微生物多樣性、宏基因組、培養組、腸菌與疾病、MWAS

擴增子基本原理:細菌/古菌 16S、真菌18S/ITS結構、引物選擇等

實驗設計:樣品製備和建庫中的誤區

文章套路:擴增子分析SCI文章的物種組成、功能預測常用套路

主流方法優缺點比較:QIIME、QIIME2、mothur、Usearch-unois3、dada2等方法

之前我們發布了基於QIIME(引用21000+)+USEARCH(引用12000+)組合的史上最詳細中文擴增子分析流程,累計閱讀10000+。

同時在2017年推出了2018年正式接檔QIIME的最新流程QIIME2的官方中文幫助文檔,累計閱讀5萬+。

想使用QIIME和QIIME2的小夥伴可直接點擊上方連結學習。課上也會帶大家用伺服器操作,分享最新私人定製流程。

但上面兩種分析流程仍有很多缺點,如需要Linux伺服器,安裝和操作複雜,學習時間成本過高等不足。

易生信團隊組織宏基因組、生信寶典的一線生信專家,為廣大生物學家,定製了一套安裝部署簡單、滑鼠點擊編程、支持主流作業系統、學習成本低、又靈活的擴增子分析流程,助力生物學家輕鬆分析數據,更專注生物學現象的挖掘。

圖6. 擴增子分析流程金字塔,數據量從下向上逐漸減少

實驗設計的編寫

Illumina測序數據的質控:fastqc, mulitqc

質控流程:雙端序列合併、切除barcode和引物、質控

生成OTU/ASV:序列去冗餘、聚類clust_otu生成OTU或unoise3去噪生成ASV(Amplicon Sequence Variants)

OTU篩選:嵌合體生成原理及去除方法、去除線粒體、葉綠體和宿主非特異擴增汙染、生成代表性序列和OTU表

物種注釋及進化樹構建

常用Alpha多樣性指數計算

常用Beta多樣性距離矩陣計算

現在你可以在自己筆記本或臺式機上輕鬆分析擴增子啦!並且支持最新的去噪生成ASV方法,想自己親自分析的朋友,快來北京參加擴增子專題培訓班吧!

圖7. 常用宏基因組統計作圖軟體STAMP & LEfSe

引用過千次的STAMP繪製Extended barplot大家應該很常見,帶你半小時速成。LEfSe引用超4000+次,它的柱狀圖和圈圖隨處可見,但伺服器超級難用,即上傳痛苦,又要久等。我們為學員定製了國內專享伺服器,隨時為你服務。有伺服器的夥伴還可以獲得安裝和使用的教程,在自己的伺服器上可重複計算,不受網絡和地域限制自己隨時隨地使用。

四、可重複計算和統計繪圖

對於可重複計算要求比較高、對細節有進一步分析要求的學員,我們還會教大家當前最頂級的R語言統計分析框架,讓你零基礎輕鬆實現可重複計算,滿足頂級文章的代碼公開和網頁可重複要求(這些資源在生信公司是價格幾十萬的絕密流程代碼,一般人是沒有機會見到的)。

圖8. 數10種高質量圖的R原始碼實現可重複計算

在自己電腦上輕鬆修改輸入文件、參數。可全程記錄分析過程,保證從數據到發表級圖形的可重複計算,讓團隊分析水平上升到大牛級別。

Alpha多樣性各種指數:Shannon、Chao1、Observed OTU、PD whole tree等,並配合Anova,LSD統計;

Beta多樣性各種距離矩陣:Bray Curtis、Jaccard、Weighted Unifrac、Unweighted Unifrac等結果的樹狀圖、箱線圖、散點圖展示樣品間差異;並配合Adonis, Anosim, MRPP統計

有監督的主坐標軸分析 (CCA/RDA),展示組間差異,anova.cca統計

DESeq/edgeR/t.test/wilcoxon統計組間差異,計算Pvalue和FDR

熱圖、曼哈頓圖、火山圖展示兩組間比較差異分類單元、OTU/ASV

韋恩圖、三元圖、網絡圖展示兩組及多組間相同與不同

五、功能預測和機器學習

學習PICRUSt分析原理、常用結果展示樣式及文章解讀。實戰進行官網、本地、在線分析,並對結果進行整理,方便STAMP、LEfSe以及R分析。下圖為預測結果經STAMP快速分析的結果展示,學員可以在老師帶領下35分鐘內完成以上分析。

圖9. 功能預測結果使用STAMP統計和可視化

對於不滿足用KEGG功能預測和統計結果的小夥伴,我們還進一步講解FAPROTAX (2016, Science)的分析,適合研究環境、元素循環的同行;此外還有BUGBASE分析,實現細菌代謝、厭氧性、革蘭氏分類等表型預測,適合醫學領域的同行使用。

圖10. 重現兩篇Nature文章機器學習分類和回歸分析

上圖:Wilck-2017-Nature,採用Adaboost進行分類和測試集驗證準確率。
下圖:Subramanian-2014-Nature,採用隨機森進行回歸、交叉驗證、測試集檢驗模型準確率和熱圖展示特徵OTUs時間序列變化。
高分文章離我們並不是遙不可及,在你的本本上,1個小時輕鬆重現每一個子圖的分析和繪製。讀懂這兩類分析的結果。

六、網絡和環境因子分析

圖11. 兩組網絡比較、以及網絡屬性比較(Wang-2018-Gut)

還以為隨便畫個網絡就能當文章的主圖嗎?這個時代早已成為歷史。現在的高分文章,至少要求多網絡比較,標配網絡屬性比較。在這裡有微生物所微生物網絡研究方向的博士,帶你進入網絡的世界,四步走實現即美觀又有意義的網絡分析:讀懂網絡——繪製單個網絡——繪製多個網絡——網絡屬性比較及可視化。這麼前沿的技術,估計世界範圍內只有這裡會教你。

圖12. 環境因子分析(Metcalf-2016-Science)

環境因子分析是很多研究的標配,常用的Vegan包引用過萬次就知道它的重要性。但平時看到的圖不是低分文章,就是不夠美觀。易生信團隊精選Rob Knight團隊2016年Science雜誌中經典環境因子分析為例,讓你的分析和可視化一步到位,向CNS看齊。

往期精彩回顧



主講教師

主講老師包括中科院微生物所、遺傳發育所、基因組所、生物物理所等多名本領域一線技術專家。

劉永鑫,博士。2008年畢業於東北農業大學微生物學,2014年於中國科學院大學獲生物信息學博士,2016年博士後出站。宏基因組公眾號創始人。目前主要研究方向有微生物組數據分析與解讀、分析方法開發與優化和科學傳播。目前以第一作者(含共同)或微生物組數據分析負責人在ScienceNature BiotechnologyCell Host & Microbe 等雜誌發表論文30餘篇,引用兩千餘次。微生物組分析平臺QIIME 2項目參與人。受邀以第一作者和/或通訊作者(含共同)在Protein & CellCurrent Opinion in Microbiology遺傳 等雜誌發表微生物組研究方法綜述。2017年7月創辦「宏基因組」公眾號,目前分享本領域相關原創文章2000餘篇,代表作品有《微生物組圖表解讀、分析流程和統計繪圖》、《QIIME2中文教程》等,關注人數11萬+,累計閱讀1800萬+。

陳同,博士,2015畢業於中科院遺傳與發育生物學研究所,生物信息專業博士,在Cell Stem Cell(IF=23.2,第一作者兼封面文章),Nucleic Acids Research X 3,Stem Cells and Development等高水平雜誌以第一作者或主要作者發表文章,運營有數萬人關注的《生信寶典》微信公眾號,給你不一樣的學習生信體驗。

授課模式

本課程以講解流程和實際操作為主,採用獨創四段式教學:

第一階段 3天集中授課;

第二階段 自行練習2周;

第三階段 在線直播答疑;

第四階段 培訓視頻繼續學習;

實現教-練-答-用四個環節的統一協調。

培訓時間

2021-4-9到 2021-4-11(線上/線下同步開放)
每天早9點到晚6點,半封閉式教學 (最後1小時為集中討論時間,最後一天會稍微提前一些,多留出時間討論,也方便老師乘車返回)
報到時間:上課當天

授課地點

線上線下同步開課:在線會議平臺,如騰訊會議。

北京市西城區鼓樓西大街41號院1號樓223(動信通文心創意園)

課程價格

1. 開課兩周前報名 4500 元/人 (住宿自行解決,提供培訓期間午餐)

2. 名額有限,每次課程報名滿40人後自動關閉報名通道

3. 提供易漢博基因科技實習機會或工作機會

注意事項 *

1. 需自備筆記本電腦。推薦使用Win10系統,4G以上內存。如果使用其它作業系統,以培訓軟體能安裝運行為主。

2. 課程實踐根據需要會提供雲計算平臺。

3. 培訓班所有數據,文檔為內部資料,僅供參閱,未經允許不得翻印外傳登刊。

4. 上課期間禁止錄音,錄像。

5. 成功付款的學員,若臨時有緊急事情不能到來的,可申請延期,更換後續培訓班;也可申請退款。

6. 若臨時有事不能參加,請提前聯繫。開課前兩周退報,預付款全退。開課前兩周內,預付款退800元,開課前一周內,預付款退500,開課前兩天,預付款不退。

7. 不可先延期再退款。

更多課程的詳細介紹,請掃描下方二維碼。

易生信同時推出多門相關課程,連報優惠——同時選2門課,95折;三門課9折,4門及以上85折。還可與團購同時優惠!推薦擴增子(入門)+宏基因組(進階)按順序學習,祝你分析水平更上一層樓,成為實驗中不可或缺的人,趕快報名吧!

訪問 http://www.ehbio.com/Training/ 或點擊閱讀原文跳轉報名頁

相關焦點

  • 微生物組-擴增子16S分析和可視化第10期(線上/線下同時開課,本年最後一期)
    /線下同時開課。報名參加線上直播課的老師可在1年內選擇參加同課程的一次線下課 。期待和大家的線上線下會晤。目前可以通報的信息:在廣大粉絲的期待下,《生信寶典》聯合《宏基因組》在北京於2020-12-4到 2020-12-6推出《擴增子16S分析》專題培訓第10期(線上課和線下課程同步開通
  • 微生物組-宏基因組分析(線上/線下同時開課,2021.1)
    報名參加線上直播課的老師可在1年內選擇參加同課程的一次線下課 。期待和大家的線上線下會晤。目前可以通報的信息:在廣大粉絲的期待下,《生信寶典》聯合《宏基因組》在2021年1月22-24日,北京鼓樓推出《宏基因組分析》專題培訓第10期(線上/線下課同時開通),為大家提供一條走進生信大門的捷徑、為同行提供一個宏基因組分析學習和交流的機會、助力學員真正理解分析原理和完成實戰分析
  • 最後一周 | 微生物組-宏基因組分析(線上/線下同時開課,2021.1)
    16S分析、宏基因組、Python課程和轉錄組的線上直播課。報名參加線上直播課的老師可在1年內選擇參加同課程的一次線下課 。期待和大家的線上線下會晤。目前可以通報的信息:在廣大粉絲的期待下,《生信寶典》聯合《宏基因組》在2021年1月22-24日,北京鼓樓推出《宏基因組分析》專題培訓第10期(線上/線下課同時開通),為大家提供一條走進生信大門的捷徑、為同行提供一個宏基因組分析學習和交流的機會、助力學員真正理解分析原理和完成實戰分析
  • 16S擴增子測序數據分析介紹
    .htmlPart 3. 21擴增子分析背景介紹p40-56.wmv,25min大家好,我叫劉永鑫,來自中國科學院遺傳與發育生物學研究所,今天很高興有這次機會為大家來講擴增子分析系列課程。本節課主要從以下4個方面進行介紹,包括為什麼要學習生物信息,什麼是微生物組?擴增子測序的基本概念以及擴增子分析的基本思路。
  • 高級轉錄組調控分析和R語言數據可視化第十三期 (線上開課)
    報名參加線上直播課的老師可在365天內選擇參加同課程的一次線下課 。期待和大家的線上線下相識。常規轉錄組是我們最常接觸到的一種高通量測序數據類型,其實驗方法成熟,花費較低,是大部分CNS必備的技術,現在就如做個PCR一樣常見。而且分析思路簡潔清晰,是入門生信,學習生信分析思路和數據可視化的首選。
  • NAR:MicrobiomeAnalyst微生物組分析師——統計、可視化和元分析微生物組數據的網頁工具
    King4,5, Luis B. Agellon3 and關於此網頁工具的使用,請閱讀本文旨在對原文解讀,幫助大家理解平臺的優缺點,同時學習自己搭建分析平臺應該注意的地方,對下一階段分析平臺開發展望的提出建設性意見。宏基因組相關分析工具:同時本文也是一篇微生物組入門分析的超好綜述,不同層次人群會有不同收穫,推薦同行必讀。
  • 報名線上課還可免費參加線下課
    報名參加線上直播課的老師可在1年內選擇參加同課程的一次線下課 。期待和大家的線上線下會晤。目前可以通報的信息:在廣大粉絲的期待下,《生信寶典》聯合《宏基因組》在2020年5月15-17日,北京鼓樓推出《宏基因組分析》專題培訓第七期(線上課已開通,可以報名,線下課程時間待定),為大家提供一條走進生信大門的捷徑、為同行提供一個宏基因組分析學習和交流的機會、助力學員真正理解分析原理和完成實戰分析
  • 菌群數據的統計和可視化方法
    微生物組研究主要分為三步走,之前已經給大家講解了實驗設計與生信分析的方法(從樣本測序數據到生成物種和功能組成表),那麼接下來為大家介紹菌群測序數據下遊分析的統計和可視化方法,包括多樣性分析、物種組成分析、微生物差異分析、相關性分析、網絡分析、機器學習(構建疾病預測模型)、進化分析、來源分析以及常用可視化方法。
  • Nature子刊:教你零基礎開展微生物組數據分析和可視化
    MG-RAST:用於注釋和存儲原始宏基因組學數據的公共資源,提供基礎的統計分析和可視化,高級分析推薦 matR 包處理; VAMPS:主要提供可視化分析,如熱圖,餅圖和主坐標分析 (PCoA) 圖等;Calypso:支持數據處理以及微生物組數據的多樣性,比較和網絡分析。
  • 16S擴增子分析專題研討論會——背景介紹
    .htmlPart 3. 21擴增子分析背景介紹p40-56.wmv,25min大家好,我叫劉永鑫,來自中國科學院遺傳與發育生物學研究所,今天很高興有這次機會為大家來講擴增子分析系列課程。本節課主要從以下4個方面進行介紹,包括為什麼要學習生物信息,什麼是微生物組?擴增子測序的基本概念以及擴增子分析的基本思路。
  • 最後1天|宏基因組分析第8期(報名直播課免費參加線下2020.7)
    福利公告:為了響應學員的學習需求,經過易生信培訓團隊的討論籌備,現決定安排擴增子16S分析、宏基因組、Python課程和轉錄組的線上直播課。報名參加線上直播課的老師可在1年內選擇參加同課程的一次線下課 。期待和大家的線上線下會晤。
  • 個人電腦搭建微生物組分析平臺(Win/Mac)
    本軟體是為Windows用戶提供軟體項目代碼版本管理和備用的工具,同時提供在Windows下運行部分Linux代碼的命令行環境,可配合Rstudio使用,高效搭建擴增子分析流程,輕鬆實現Windows下擴增子數據的分析和可視化
  • 121個人電腦搭建微生物組分析平臺(Win/Mac)
    本軟體是為Windows用戶提供軟體項目代碼版本管理和備用的工具,同時提供在Windows下運行部分Linux代碼的命令行環境,可配合Rstudio使用,高效搭建擴增子分析流程,輕鬆實現Windows下擴增子數據的分析和可視化
  • 2019微生物組—宏基因組分析專題培訓開課啦!
    易生信團隊獨創實現了跨平臺的分析流程,在大家的Windows筆記本上可以輕鬆實現擴增子、宏基因組領域統計、可視化的絕大多數分析,第三節課帶你輕鬆在自己的本本上搭建數據表統計分析與可視化平臺,基於目前最主流的Win10進行優化和測試,讓筆記本秒變數據分析可視化平臺。
  • 相對豐度會歪曲實際豐度,聯合16S擴增子測序和總菌qPCR獲得的絕對豐度可靠嗎?
    我們想確定使用總細菌負荷和相對豐度相結合的方法來推斷細菌絕對豐度是否準確可靠。我們分析了來自20名有細菌性生殖道病史的女性的1320份樣本,這些女性在60天內每天自行收集生殖道拭子樣本。我們通過獲取物種相對豐度(通過16S擴增子測序獲得)和總細菌載量(通過細菌16S通用引物 qPCR獲得)的乘積來推斷每個細菌的絕對豐度。
  • 擴增子分析QIIME2. 1簡介和安裝
    擴增子分析QIIME2. 1簡介和安裝QIIME2版本 2017.6聲明:本文為QIIME2官方幫助文檔的中文版,
  • 擴增子分析解讀4去嵌合體,非細菌序列,生成代表性序列和OTU表
    《擴增子分析解讀》系列文章介紹擴增子分析是目前宏基因組研究中最常用的技術,由於微生物組受環境影響大,實驗間重複較差,更需要更多的實驗重複和分析技術來保證結果的準確性、可重複性。本系統文章叫分析解讀,即有詳細的擴增子分析流程代碼,又有本人對使用參數、備選參數意義的解讀,可以讓大部分零基礎的人,更好的理解數據分析過程,並可親自實踐在自己的課題上,獲得更好、更合理的實驗結果。本文採用目前最主流的擴增子測序數據類型HiSeq2500 PE250類型數據為例,結合目前主流方法QIIME+USearch定製的分析流程。
  • 16S/18S/ITS 擴增子測序
    在原核微生物核糖體中的16S rRNA基因長度約為1500 bp,因其結構與功能上的高度保守性,常用於菌種鑑定和系統發育分析。與16S rRNA類似,真核微生物18S rRNA基因長度1500-2000 bp,常用於研究環境樣本中真核微生物群落結構多樣性,其中,真菌rRNA基因的非轉錄區還包含一段隱秘的內轉錄間隔區(Internal Transcribed Spacer,ITS),長度為400-900bp,由於種內保守,種間差異明顯,也非常適於種類鑑定和群落分析。
  • 擴增子圖表解讀2散點圖:組間整體差異分析(Beta多樣性)
    背景介紹(Introduction)宏基因組學宏基因組學目前的主要研究方法包括:16S/ITS/18S擴增子、宏基因組、宏轉錄組和代謝組,其中以擴增子研究最為廣泛。如果本系統文章閱讀過萬,想學分析的留言過百。我還將詳細講解擴增子分析、統計和繪圖各步驟的分析實例和原始碼,希望大家多多鼓勵和支持。聲明:文章的解讀僅代表個人理解和觀點,有不足處,請讀者積極留言批評指正,互相學習,共同進步。知識點(Method)散點圖數據點在直角坐標系平面上的分布圖。
  • Nature綜述:Rob Knight帶你分析微生物組數據(2020版)
    Qiita和EBI是強大的組學分析和數據存檔工具,二者結合起來可以使研究者在成千上萬的其他樣品的大數據背景下分析自己的微生物組數據,並與發表數據進行比較,同時這些數據也可以被其他研究人員輕鬆訪問並使用。