福利公告:為了響應學員的學習需求,經過易生信培訓團隊的討論籌備,現決定安排擴增子16S分析、宏基因組、轉錄組的線上/線下同時開課。報名參加線上直播課的老師可在1年內選擇參加同課程的一次線下課 。期待和大家的線上線下會晤。
目前可以通報的信息:
在廣大粉絲的期待下,《生信寶典》聯合《宏基因組》在北京於2021-4-9到 2021-4-11推出《擴增子16S分析》專題培訓第11期(線上課和線下課程同步開通),為大家提供一條走進生信大門的捷徑、為同行提供一個擴增子分析實戰學習和交流的機會、助力學員真正理解分析原理和完成實戰分析,獨創四段式教學(3天集中授課+自行練習2周+集中講解答疑+上課視頻回看反覆練習),「教—練—答—用」四個環節統一協調,真正實現獨立分析大數據。
關於學習生物信息學分析的重要性,請閱讀《生物信息9天速成班—成為團隊中不可或缺的人》。
課程簡介宏基因組/微生物組是當今世界科研最熱門的研究領域之一,為加強本領域的技術交流與傳播,推動中國微生物組計劃發展,中科院青年科研人員創立「宏基因組」公眾號,目標為打造本領域純乾貨技術及思想交流平臺。成立兩年,分享專業技術原創文章2400+篇,關注人數11萬+,累計閱讀量18,000,000+。
請詳細閱讀課程簡介,如果以下內容您全精通,不必參加此培訓。
本課程一共3天,每天6節課,共18節課,全部課程均理論與實戰結合(只要課上講的內容,都是要帶你親自實現的分析)。從分析平臺搭建、Linux和R基礎、圖表解讀和繪圖實戰、擴增子分析標準流程、功能預測、差異統計分析以及各類高級分析(進化樹、網絡、環境因子、隨機森林、Adaboost和來源追溯等),和CNS級圖片編輯和排版。3天時間,老司機帶您完成自學需要3個月甚至是3年的崎嶇之路,助力您真正玩轉擴增子分析。
課程大綱每節課1小時一個主題,理論結合實戰,學懂原理,實戰操作,全是老司機多年經驗和代碼的無私分享。下面是課程安排,如11代表第一天第一節課,26代表第二天第六節課,41為兩周後的線上集中視頻答疑。
教程內容簡介如下:
還在為沒有Linux伺服器而無法分析擴增子數據而苦惱嗎?其實你的個人電腦就是擴增子分析的利器。易生信團隊獨創實現了跨平臺的分析流程,在大家的Windows筆記本上可以輕鬆實現擴增子領域的絕大多數分析,第一節課帶你輕鬆在自己的本本上搭建數據分析平臺。
圖1. 易生信首創基於Win10優化的擴增子分析流程,筆記本秒變大數據分析平臺
推薦使用Windows10系統,8G及以上內存分析更流暢。 我們也會分享給大家在Linux上配置整個分析流程的代碼 (Mac跟Linux類似,無須區別對待,但部分軟體可能安裝方式不同,未做深入測試,不建議參加培訓時使用)。
同時講解生物學家必要掌握的Shell和R語言基礎知識,保證你高效、穩定的使用擴增子分析平臺。
圖2. Shell和R學習大綱,首創Rstuio中滑鼠點擊可完成Shell腳本和R語言分析,既打開生信的大門,又不會增加生物學家時間成本
二、圖表解讀和繪製針對很多老師缺少系統的生信背景,看不懂分析文章圖表,更對繪製各式圖表手足無措。
我們推出過如下兩個系列,共16篇原創文章,對8種圖形進行講解和R語言繪圖。
但這些只是入門,在培訓上,我們將結合發表高水平文章,進一步講解16種常用分析圖型結果的原理和使用範圍,讓您不僅讀懂圖,更知道如何應用於自己的研究,並親自輕鬆完成繪圖。
針對大家使用R語言繪圖學習時間成本較高的問題,易生團隊針對常用16種圖開發了免費繪圖網站,一鍵出圖,更可滑鼠點選參數修改圖形的個性樣式。
圖3. 16種常用圖形的繪製。可使用我們的在線繪圖工具實現。
為了讓各種統計圖片實現出版級的組圖,特開設了一節Adobe Illustrator修圖排版課,講述基本使用技巧,輕鬆掌握精髓,讓你文章圖版檔次向CNS看齊,輕鬆成為實驗室的修圖和拼圖達人。
圖4. AI排版本子圖為CNS出版級組圖示例(Science, 2016封面文章)
三、擴增子基礎和分析流程圖5. 典型的擴增子結構模型圖
背景:國際微生物組(人類HMP、環境EMP)計劃、中國微生物組計劃
研究對象:人、動物、植物、環境
研究方法:培養組學、擴增子測序 (最常用)、宏基因組、宏轉錄組、宏蛋白組、宏代謝組、宏表觀組等
宏基因組學的研究熱點:微生物多樣性、宏基因組、培養組、腸菌與疾病、MWAS
擴增子基本原理:細菌/古菌 16S、真菌18S/ITS結構、引物選擇等
實驗設計:樣品製備和建庫中的誤區
文章套路:擴增子分析SCI文章的物種組成、功能預測常用套路
主流方法優缺點比較:QIIME、QIIME2、mothur、Usearch-unois3、dada2等方法
之前我們發布了基於QIIME(引用21000+)+USEARCH(引用12000+)組合的史上最詳細中文擴增子分析流程,累計閱讀10000+。
同時在2017年推出了2018年正式接檔QIIME的最新流程QIIME2的官方中文幫助文檔,累計閱讀5萬+。
想使用QIIME和QIIME2的小夥伴可直接點擊上方連結學習。課上也會帶大家用伺服器操作,分享最新私人定製流程。
但上面兩種分析流程仍有很多缺點,如需要Linux伺服器,安裝和操作複雜,學習時間成本過高等不足。
易生信團隊組織宏基因組、生信寶典的一線生信專家,為廣大生物學家,定製了一套安裝部署簡單、滑鼠點擊編程、支持主流作業系統、學習成本低、又靈活的擴增子分析流程,助力生物學家輕鬆分析數據,更專注生物學現象的挖掘。
圖6. 擴增子分析流程金字塔,數據量從下向上逐漸減少
實驗設計的編寫
Illumina測序數據的質控:fastqc, mulitqc
質控流程:雙端序列合併、切除barcode和引物、質控
生成OTU/ASV:序列去冗餘、聚類clust_otu生成OTU或unoise3去噪生成ASV(Amplicon Sequence Variants)
OTU篩選:嵌合體生成原理及去除方法、去除線粒體、葉綠體和宿主非特異擴增汙染、生成代表性序列和OTU表
物種注釋及進化樹構建
常用Alpha多樣性指數計算
常用Beta多樣性距離矩陣計算
現在你可以在自己筆記本或臺式機上輕鬆分析擴增子啦!並且支持最新的去噪生成ASV方法,想自己親自分析的朋友,快來北京參加擴增子專題培訓班吧!
圖7. 常用宏基因組統計作圖軟體STAMP & LEfSe
引用過千次的STAMP繪製Extended barplot大家應該很常見,帶你半小時速成。LEfSe引用超4000+次,它的柱狀圖和圈圖隨處可見,但伺服器超級難用,即上傳痛苦,又要久等。我們為學員定製了國內專享伺服器,隨時為你服務。有伺服器的夥伴還可以獲得安裝和使用的教程,在自己的伺服器上可重複計算,不受網絡和地域限制自己隨時隨地使用。
四、可重複計算和統計繪圖對於可重複計算要求比較高、對細節有進一步分析要求的學員,我們還會教大家當前最頂級的R語言統計分析框架,讓你零基礎輕鬆實現可重複計算,滿足頂級文章的代碼公開和網頁可重複要求(這些資源在生信公司是價格幾十萬的絕密流程代碼,一般人是沒有機會見到的)。
圖8. 數10種高質量圖的R原始碼實現可重複計算
在自己電腦上輕鬆修改輸入文件、參數。可全程記錄分析過程,保證從數據到發表級圖形的可重複計算,讓團隊分析水平上升到大牛級別。
Alpha多樣性各種指數:Shannon、Chao1、Observed OTU、PD whole tree等,並配合Anova,LSD統計;
Beta多樣性各種距離矩陣:Bray Curtis、Jaccard、Weighted Unifrac、Unweighted Unifrac等結果的樹狀圖、箱線圖、散點圖展示樣品間差異;並配合Adonis, Anosim, MRPP統計
有監督的主坐標軸分析 (CCA/RDA),展示組間差異,anova.cca統計
DESeq/edgeR/t.test/wilcoxon統計組間差異,計算Pvalue和FDR
熱圖、曼哈頓圖、火山圖展示兩組間比較差異分類單元、OTU/ASV
韋恩圖、三元圖、網絡圖展示兩組及多組間相同與不同
五、功能預測和機器學習學習PICRUSt分析原理、常用結果展示樣式及文章解讀。實戰進行官網、本地、在線分析,並對結果進行整理,方便STAMP、LEfSe以及R分析。下圖為預測結果經STAMP快速分析的結果展示,學員可以在老師帶領下35分鐘內完成以上分析。
圖9. 功能預測結果使用STAMP統計和可視化
對於不滿足用KEGG功能預測和統計結果的小夥伴,我們還進一步講解FAPROTAX (2016, Science)的分析,適合研究環境、元素循環的同行;此外還有BUGBASE分析,實現細菌代謝、厭氧性、革蘭氏分類等表型預測,適合醫學領域的同行使用。
圖10. 重現兩篇Nature文章機器學習分類和回歸分析
上圖:Wilck-2017-Nature,採用Adaboost進行分類和測試集驗證準確率。
下圖:Subramanian-2014-Nature,採用隨機森進行回歸、交叉驗證、測試集檢驗模型準確率和熱圖展示特徵OTUs時間序列變化。
高分文章離我們並不是遙不可及,在你的本本上,1個小時輕鬆重現每一個子圖的分析和繪製。讀懂這兩類分析的結果。
圖11. 兩組網絡比較、以及網絡屬性比較(Wang-2018-Gut)
還以為隨便畫個網絡就能當文章的主圖嗎?這個時代早已成為歷史。現在的高分文章,至少要求多網絡比較,標配網絡屬性比較。在這裡有微生物所微生物網絡研究方向的博士,帶你進入網絡的世界,四步走實現即美觀又有意義的網絡分析:讀懂網絡——繪製單個網絡——繪製多個網絡——網絡屬性比較及可視化。這麼前沿的技術,估計世界範圍內只有這裡會教你。
圖12. 環境因子分析(Metcalf-2016-Science)
環境因子分析是很多研究的標配,常用的Vegan包引用過萬次就知道它的重要性。但平時看到的圖不是低分文章,就是不夠美觀。易生信團隊精選Rob Knight團隊2016年Science雜誌中經典環境因子分析為例,讓你的分析和可視化一步到位,向CNS看齊。
往期精彩回顧主講老師包括中科院微生物所、遺傳發育所、基因組所、生物物理所等多名本領域一線技術專家。
劉永鑫,博士。2008年畢業於東北農業大學微生物學,2014年於中國科學院大學獲生物信息學博士,2016年博士後出站。宏基因組公眾號創始人。目前主要研究方向有微生物組數據分析與解讀、分析方法開發與優化和科學傳播。目前以第一作者(含共同)或微生物組數據分析負責人在Science、Nature Biotechnology、Cell Host & Microbe 等雜誌發表論文30餘篇,引用兩千餘次。微生物組分析平臺QIIME 2項目參與人。受邀以第一作者和/或通訊作者(含共同)在Protein & Cell、Current Opinion in Microbiology、遺傳 等雜誌發表微生物組研究方法綜述。2017年7月創辦「宏基因組」公眾號,目前分享本領域相關原創文章2000餘篇,代表作品有《微生物組圖表解讀、分析流程和統計繪圖》、《QIIME2中文教程》等,關注人數11萬+,累計閱讀1800萬+。
陳同,博士,2015畢業於中科院遺傳與發育生物學研究所,生物信息專業博士,在Cell Stem Cell(IF=23.2,第一作者兼封面文章),Nucleic Acids Research X 3,Stem Cells and Development等高水平雜誌以第一作者或主要作者發表文章,運營有數萬人關注的《生信寶典》微信公眾號,給你不一樣的學習生信體驗。
授課模式本課程以講解流程和實際操作為主,採用獨創四段式教學:
第一階段 3天集中授課;
第二階段 自行練習2周;
第三階段 在線直播答疑;
第四階段 培訓視頻繼續學習;
實現教-練-答-用四個環節的統一協調。
培訓時間2021-4-9到 2021-4-11(線上/線下同步開放)
每天早9點到晚6點,半封閉式教學 (最後1小時為集中討論時間,最後一天會稍微提前一些,多留出時間討論,也方便老師乘車返回)
報到時間:上課當天
線上線下同步開課:在線會議平臺,如騰訊會議。
北京市西城區鼓樓西大街41號院1號樓223(動信通文心創意園)
課程價格1. 開課兩周前報名 4500 元/人 (住宿自行解決,提供培訓期間午餐)
2. 名額有限,每次課程報名滿40人後自動關閉報名通道
3. 提供易漢博基因科技實習機會或工作機會
注意事項 *1. 需自備筆記本電腦。推薦使用Win10系統,4G以上內存。如果使用其它作業系統,以培訓軟體能安裝運行為主。
2. 課程實踐根據需要會提供雲計算平臺。
3. 培訓班所有數據,文檔為內部資料,僅供參閱,未經允許不得翻印外傳登刊。
4. 上課期間禁止錄音,錄像。
5. 成功付款的學員,若臨時有緊急事情不能到來的,可申請延期,更換後續培訓班;也可申請退款。
6. 若臨時有事不能參加,請提前聯繫。開課前兩周退報,預付款全退。開課前兩周內,預付款退800元,開課前一周內,預付款退500,開課前兩天,預付款不退。
7. 不可先延期再退款。
更多課程的詳細介紹,請掃描下方二維碼。
易生信同時推出多門相關課程,連報優惠——同時選2門課,95折;三門課9折,4門及以上85折。還可與團購同時優惠!推薦擴增子(入門)+宏基因組(進階)按順序學習,祝你分析水平更上一層樓,成為實驗中不可或缺的人,趕快報名吧!。
訪問 http://www.ehbio.com/Training/ 或點擊閱讀原文跳轉報名頁