Microbiome Discovery 宏基因組入門課程

2021-02-14 生信菜鳥團

偶然間在 youtube 上看到 Dan Knights 的 Microbiome Discovery 宏基因組入門課程,大致瀏覽了一下,由淺入深,從理論到實踐講得非常不錯,真是相見恨晚 QAQ,只看這個應該完全足夠入門宏基因組了~

課程播放列表:https://www.youtube.com/playlist?list=PLOPiWVjg6aTzsA53N19YqJQeZpSCH9QPc

RMarkdown 示例數據及實踐代碼:https://github.com/danknights/mice8992-2016

視頻目錄1. Intro to the Microbiome

•介紹微生物組•如何進行研究•面對的一些挑戰(微生物組數據相對不穩定,biomarker discovery)

網址 https://youtu.be/6564K4-_DBI

2. How microbiome data are generated

•如何產生這些數據的•兩種測序方法的優劣•宏基因組測序•擴增子測序

網址 https://youtu.be/FWT1HBzlWOE

3. 16S Variable Regions

•為什麼選擇 16S 片段,16S rRNA 的結構功能•OTU 從何而來

網址 https://youtu.be/8Aa_mnyXm70

4. QIIME

•QIIME 分析流程介紹

網址 https://youtu.be/iy0JWgzmM_A

4.5. (Optional) UNIX Command Line

•UNIX 命令介紹以及 Git 的使用

網址 https://youtu.be/u2IQQUMeWy8

5. Picking OTUs

•OTU 聚類方法•closed reference•de novo•UCLUST•CD-HIT•SUMACLUST•mothur•SWARM•open reference

網址 https://youtu.be/Ok5h24KZbAE

6. Assigning Taxonomy

•如何注釋菌群分類•The Random Forests classifier seems to work better•Nearest neighbor using optimal gapped alignment with large reference databases will probably win eventually

網址 https://youtu.be/HkwFdzFLZ0I

7. Alpha Diversity

•Alpha diversity measures diversity within communities•Beta diversity measures diversity between communities•Rarefaction determines saturation•There is room for experimental validation•不同計算 Alpha Diversity 的方法•species count•phylogenetic diversity (PD)•Chao1 Estimator

網址 https://youtu.be/9ZvoR89HYP8

8. Beta Diversity

•Beta diversity measures diversity between communities•不同 Beta Diversity 的計算方法•euclidean distance•Chi-square distance, Chi-square is usually best for gradients•Bray-Curtis•Most people use Bray Curtis or UniFrac•用 PCoA 可視化

網址 https://youtu.be/lcbp6EecDg4

9. UniFrac

•Beta diversity using UniFrac

網址 https://youtu.be/M8ylvsS0MHg

10. Statistical testing part 1

•統計學基礎•Linear models are not always appropriate•Non-parametric tests (no distribution assumptions)•Generalized linear models(better underlying distributions)

網址 https://youtu.be/_uDv7LRUUsY

11. Statistical testing part 2

•統計學基礎•t-test:Compare 2 groups•ANOVA:Compare three or more groups•Correlation:Compare to a continuous variable (e.g.Age)•Linear Regression:Similar to correlation,but you can regress on multiple variables at the same time•NOTE:all of these assume normal distributions!•When linear regression tests do not have normally distributed residuals,use a generalized linear model with the negative binomial distribution.This is in the edgeR package in R.•Use false discovery rate (FDR) to correct for multiple hypothesis testing.•If you don't need to control for confounders, non-parametric tests are very safe (although lower power than linear models or generalized linear models).•Two-category test:Mann-Whitney U (Wilcoxon) test (like a t-test)•Multi-category test:Kruskal-Wallis (like ANOVA)•Continuous test:Spearman correlation (like Pearson correlation)

網址 https://youtu.be/tNxfYqa5Rtc

12. Visualizing Microbiome Diversity, Ordination

•用 R 或 QIIME 可視化•PCA•PCoA•NMDS

網址 https://youtu.be/H-u2iyiTzj0

13. Detrending and detecting gradients

•用 QIIME 進行 detrending•Detrending does not have strong statistical foundations•Use detrending for visualizing a primary gradient•Use detrending to test whether your ordination recovered the primary gradient in axis 1

網址 https://youtu.be/aNLPzdfivkM

14. Constrained Ordination

•CCA does direct gradient analysis•Never use more than 3-4 variates•More will simply over fit the data•Measure success by ratio of constrained variance explained to unconstrained variance explained•Canonical Correspondence analysis == Constrained Correspondence analysis•Not to be confused with canonical correlation analysis

網址 https://youtu.be/wHSECEI2tnQ

15. Clustering

•Use caution with supervised ordination - need to assess significance carefully•Prediction strength >0.9 or Silhouette index >0.5•Clusters can be useful ways to analyze high-dimensional data•However, direct analysis is generally better when you have known gradients/groups•Diagnostics based on direct supervised analysis generally better

網址 https://youtu.be/ORX968xJqiA

16. Supervised Learning Background

•Supervised learning tries to learning a model that will predict outcomes for novel samples•Example: classify cancer patients to determine treatment path•Models have to balance low complexity (underfitting) and high complexity (overfitting)•Model accuracy should be assessed in separate test data that it has never seen•10-fold cross validation is standard

網址 https://youtu.be/-eXnrA_3xzA

17. Supervised Learning Applications

•用 QIIME 進行隨機森林分類

網址 https://youtu.be/ecz5SzP6Z_U

18. Source Tracking

•介紹 Source Tracking 實現原理以及 SourceTracker 應用•Microbial source tracking can be done at the community-wide level•SourceTracker uses Bayesian methods to deconvolute mixtures of communities•Can identify contributions of individual species from each source environment•Does not model changes after mixing (temporal dynamics)•SourceTracker:github.com/danknights/sourcetracker/releases

網址 https://youtu.be/sDevHMuYJ28

19. Compositionality

•Compositionality can cause spurious and even opposite conclusions•Dominant bugs can skew the relative abundance of minor bugs•Correlation is hard to infer•See Sparco, SPIEC-EASI•Best to do analysis with absolute abundances when possible•Spike-ins of foreign bugs and/or q PCR can circumvent this

網址 https://youtu.be/X60nFYpLWRs

20. PICRUSt and predicting functions

. PICRUSt and predicting functions

•Shotgun metagenomics can describe the full functional repertoire of a metagenome, but it is expensive•PICRUSt can produce 80-85% accurate metagenomes from 16S data sets•Useful for mining published data•Can be used to select a subset of 16S samples for shotgun sequencing•Be sure to treat the results as "suggestive only"in publications•Mostly useful on human gut samples

網址 https://youtu.be/mPQCl_cHCsM

21. Shotgun Taxonomy

•Shotgun metagenomics can be used for identifying species•Far superior to 16S•Approaches to Shotgun taxonomy•MetaPhlAn and MetaPhlAn2•Pre-identify a set of marker genes•Genes that are conserved within a species but not elsewhere•Requires alignment,but uses small database•Kraken,others•Use all unique k-mers as markers•UItrafast,but large database

網址 https://youtu.be/DlQTXdb2rhg

看到這裡的小夥伴恭喜你發現了隱藏福利~ 我幫大家搬運了全集

連結:https://pan.baidu.com/s/194r0zs5WbcNFQKQrV0Nnkg  密碼:0rjr

生信技能樹目前已經公開了三個生信知識庫,記得來關注哦~

每周文獻分享

https://www.yuque.com/biotrainee/weeklypaper

腫瘤外顯子分析指南

https://www.yuque.com/biotrainee/wes

生物統計從理論到實踐

https://www.yuque.com/biotrainee/biostat

友情宣傳

強烈建議你推薦給身邊的博士後以及年輕生物學PI,多一點數據認知,讓他們的科研上一個臺階:

•底褲價轉錄組產品線(還送數據分析培訓)(八九百一個樣品)•三維基因組學分析實戰培訓班,線上直播課,2天僅需399(生信技能樹粉絲特權價格)•生信技能樹的2019年終總結 ,你的生物信息學成長寶藏•2020學習主旋律,B站74小時免費教學視頻為你領路

相關焦點

  • Review:Microbiota, metagenome, microbiome傻傻分不清
    點擊上方藍色「宏基因組」關注我們!專業乾貨每日推送!
  • Nature綜述:Microbiota, metagenome, microbiome傻傻分不清
    The synonymous term microbiome describes either the collective genomes of the microorganisms that reside in an environmental niche or the microorganisms themselves.
  • Microbiome:CAMISIM模擬宏基因組和微生物群落
    de novo方法包括四種類型的群落:a單個模擬的宏基因組樣本:對數正態分布中抽取分類學信息;b時間序列的宏基因組樣本:對數正態分布+高斯噪聲中抽取分類學信息,添加正態分布不斷的得到樣本;c一系列重複模擬的宏基因組樣本:對數正態分布中抽取分類學信息,並在對數正態分布中重複添加高斯噪聲;d不同豐度的宏基因組樣本:對數正態分布中抽取分類學信息。
  • 2019微生物組—宏基因組分析專題培訓第三期
    課程簡介請詳細閱讀課程簡介,如果以下內容您全精通,不必參加此培訓。宏基因組/微生物組是當今世界科研最熱門的研究領域之一,為加強本領域的技術交流與傳播,推動中國微生物組計劃發展,中科院青年科研人員創立「宏基因組」公眾號,目標為打造本領域純乾貨技術及思想交流平臺。
  • 利用深度變體自動編碼器改進宏基因組的組裝
    利用深度變體自動編碼器改進宏基因組的組裝 作者:小柯機器人 發布時間:2021/1/5 16:19:03 丹麥哥本哈根大學Simon Rasmussen課題組的最新研究利用深度變體自動編碼器改進了宏基因組的組裝。
  • 宏基因組和代謝組學揭示結直腸癌相關菌群的階段特異性
    宏基因組和代謝組學揭示結直腸癌相關菌群的階段特異性 作者:小柯機器人 發布時間:2019/7/11 16:13:03 宏基因組和代謝組學揭示結直腸癌相關腸道菌群的階段特異性,這一成果由東京工業大學Takuji Yamada研究團隊獲得
  • JoVE微生物組專刊徵稿,寫方法拍視頻教程發SCI(宏基因組公眾號專屬福利)
    寫方法發SCI宏基因組公眾號有近9萬海內外華人同行關注,現受JoVE雜誌邀請作為客座主編組織微生物組分析和可視化方法學專刊。邀請信社交版致宏基因組公眾號用戶:迄今為止,儘管在微生物組分析中共享新技術和分析方法這類文章至關重要,但迄今為止很少有期刊可以接受視頻文章供我們發表。
  • 你想要的宏基因組-微生物組知識全在這(2020.9)
    宏基因組/微生物組是當今世界科研最熱門的研究領域之一,為加強宏基因組學技術和成果交流傳播,推動全球華人微生物組領域發展,中科院青年科研人員創立「宏基因組」公眾號,聯合海內外同行共同打造本領域純乾貨技術及思想交流平臺。
  • 宏基因組02. HUMAnN2 --宏基因組代謝通路分析
    本系列課程前情回顧宏基因組分析00. 概述和分析環境的部署宏基因組分析01.
  • nanopore宏基因組分析培訓班(第2期)開始報名了
    我們第六期納米孔測序培訓班將專門關注納米孔測序在宏基因組中的應用。本次培訓班,我們將系統介紹納米孔測序在宏基因組中的應用,通過本次培訓班你將完成以下五大主題:1、熟悉納米孔測序;2、掌握納米孔宏基因組測序物種分類;3、宏基因組數據分結果可視化;4、掌握納米孔宏基因組測序基因組拼接;5、從納米孔宏基因組拼接中得到細菌完成圖。
  • Nature子刊:HUMAnN2實現宏基因組和宏轉錄組種水平功能組成分析
    Gregory Caporaso,  Nicola Segata簡介HUMAnN是一款快速宏基因組功能組成定量工具,第一版2012年發表於PLoS computational biology (當年還沒有影響因子,最新17年3.9,歷史最高14年4.6),截止2018年11月1號Google Scholar統計引用557次。
  • 三代nanopore宏基因組測序數據分析,北京,11月7-9日
    本期主題圍繞「nanopore宏基因組測序數據分析」,nanopore測序實時,快速,便攜,長度長,高通量等諸多特點,特別適合微生物研究。在新冠病毒研究以及後續病毒溯源方面都會有重要的應用。本次培訓班,我們將系統介紹納米孔測序在宏基因組中的應用,通過本次培訓班你將完成以下四大主題:1、熟悉納米孔測序;2、病原微生物快速鑑定;3、宏基因組數據分結果可視化;4、納米孔建庫測序實驗。課程特色1、真正的小班授課,提供助教,提供一對一指導,零基礎可學習。2.
  • 「量子化學入門」課程
    最近接到「研之成理」的邀請,推出了一個短系列的「量子化學入門」線上課程,課程針對沒有接觸過量子化學計算的研究者,目的是希望這類同學能對量子化學計算有所了解並能在自己的研究中用上量子化學計算
  • 資源分享 | 微生物組分析必備書籍《Microbiome Analysis》
    宏基因組的組裝和重疊群的分配13. 從RNA測序到生物學推斷:使用宏轉錄組進行成分數據分析14. 基因組精度的亞採樣組裝和雜交核苷酸組成/宏基因組的差異覆蓋度區域分箱15. 跨界網絡:識別宿主-微生物組相互作用因果成員的系統生物學方法16. 在R中構建和分析微生物組網絡17.
  • 多快好省的宏基因組研究技巧
    不過淺宏基因組也有其適用範圍,根據樣品類型的不同,一些樣品可能包含 >99%的人類宿主DNA,這不僅增加了序列成本,而且給測量帶來了不確定性。在許多研究中也會採取在進行宏基因組測序文庫的準備之前去除宿主DNA的方法。但是,在去除宿主DNA後,可能沒有足夠的微生物基因組DNA用於宏基因組測序,這通常需要最少50ng的輸入。
  • 通過對一系列宏基因組的亞胺還原酶進行篩選和表徵實現生物催化...
    通過對一系列宏基因組的亞胺還原酶進行篩選和表徵實現生物催化還原胺化 作者:小柯機器人 發布時間:2021/1/3 15:32:48 英國曼徹斯特大學的Nicholas J.
  • 【課程預告】手把手教你入門生信——The Biostar Handbook
    我曾經在《小白生信學習記》裡多次推薦和引用一個網絡課程:http://www.personal.psu.edu/iua1/courses
  • 高中化學電子式入門課程第一講
    高考化學必考考點之電子式入門課程第一講本次課程為物資的電子式入門課程的第一講,主要講解什麼是電子式,電子式的物理含義是什麼,該如何進行元素的電子式的書寫,這次課程結束後,希望大家能夠會書寫元素的電子式。
  • 【音頻信號處理專欄】【2】入門書籍和課程推薦連結索引
    這篇文章是對【音頻信號處理專欄】【2】入門書籍和課程推薦 裡的補充,主要是方便大家可以直接從這裡進入到當當網購買書籍了,是不是很方便
  • DNA/RNA-SIP與宏基因組
    DNA/RNA-SIP與宏基因組