QIIME 2用戶文檔. 11元數據Metadata(2019.7)

2021-02-14 宏基因組
前情提要QIIME 2用戶文檔. 9元數據

Metadata in QIIME 2

https://docs.qiime2.org/2019.7/tutorials/metadata/

註:此實例需要一些基礎知識,要求完成本系列文章前兩篇內容:《1簡介和安裝》和《4人體各部位微生物組分析》。

詳者註:什麼是元數據?是描述數據的數據,樣本信息是樣本元數據,物種注釋是特徵元數據。

元數據提供了從數據中獲得生物學發現的關鍵。在QIIME 2中,樣本元數據可以包括更多技術細節,例如在多次測序批次中用於每個樣本的DNA條形碼,或者樣本的描述,例如每個樣本來自人類微生物組對應時間序列研究中的分組、時間點和身體部位。特徵元數據通常是特徵注釋,例如分配給序列變量或OTU的物種注釋。QIIME 2中的許多插件都使用樣本和特徵元數據,本教程(以及其他QIIME 2教程)中提供了示例,說明如何在自己的微生物組分析中使用元數據。

元數據通常用於特定的微生物組研究而編寫,收集樣本元數據通常是在開始QIIME 2分析之前要進行的第一步。由研究人員決定哪些信息是作為元數據收集和跟蹤的。QIIME 2不限制期望存在的元數據類型;沒有強制執行的「元數據標準」。這是你跟蹤任何你認為對你的分析很重要的信息的機會,不幸的是,QIIME 2不能為你收集這些信息。如果有疑問,儘可能多的收集元數據,因為您可能無法追溯收集某些類型的信息

提示:雖然QIIME 2沒有對要收集的元數據類型執行標準,但MIMARKS標準(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3367316/ 或 https://www.nature.com/articles/nbt.1823)為微生物組研究提供了建議,並可能有助於確定研究中要收集的信息。如果計劃將數據存儲在數據存檔(例如ENA或QIITA)中,那麼確定存檔所期望的元數據類型也很重要,因為每個存檔可能都有其自己特定的要求。

元數據格式要求

Metadata Formatting Requirements

QIIME 2元數據通常存儲在TSV(即制表符分隔)文件中。這些文件通常具有.tsv或.txt文件擴展名,但QIIME 2使用什麼文件擴展名並不重要。TSV文件是用於存儲表格數據的簡單文本文件,其格式受多種軟體支持,如從電子表格程序和資料庫中編輯、導入和導出。因此,使用您選擇的軟體操作編輯QIIME 2元數據通常很簡單。如果有疑問,我們建議使用電子表格程序(如Microsoft Excel或Google工作表)編輯和導出元數據文件。

注: 除了TSV文件之外,QIIME 2對象(即qza文件)也可以用作元數據。有關詳細信息,請參閱下面使用QIIME 2對象作為元數據的部分。QIIME 2將來還可能支持其他文件格式。

QIIME 1用戶: 在QIIME 1中,TSV元數據文件被稱為映射文件(mapping files)。在QIIME 2中,我們將這些文件稱為元數據文件,但它們在概念上是相同的。QIIME 2元數據文件與QIIME 1映射文件向後兼容,這意味著您可以在QIIME 2中使用現有的QIIME 1映射文件,而無需對該文件進行修改。
以下各節介紹了QIIME 2元數據文件的格式要求,以及如何驗證元數據文件。由於TSV文件沒有通用標準,因此必須遵守如下要求,並了解QIIME 2如何解釋文件內容,以充分利用元數據!

元數據驗證

Metadata Validation

存儲在谷歌工作表中的樣品和功能元數據文件可以使用keemi插件進行驗證。選擇加載項>Keemi>驗證QIIME 2元數據文件以驗證存儲在谷歌工作表中的元數據。

QIIME 2還將在軟體使用元數據文件時自動驗證該文件。但是,建議使用keemi驗證元數據,因為每次運行keemi時都會顯示所有驗證錯誤和警告信息的報告。在QIIME 2中加載元數據通常一次只會出現一個錯誤,特別是在元數據有很多問題的情況下,這會使識別和解決驗證問題變得很麻煩。

註:將來,將有一個QIIME元數據驗證命令來在QIIME 2中執行keemi類似的驗證(例如,如果使用Google工作表對您來說不是一個可選項,中國大陸很多用戶使用Google工作表存在一定困難)。

前導和尾隨空格字符

Leading and trailing whitespace characters

如果元數據中的任何單元格包含前導或尾隨空格字符(例如空格、制表符),則加載文件時將忽略這些字符。因此,前導和尾隨空格字符不重要,因此包含值「gut」和「  gut  」的單元格是等效的。此規則在下面描述的任何其他規則之前應用。

注釋和空行

Comments and Empty Rows

第一個單元格以井號(#)開頭的行被解釋為注釋,並可能出現在文件中的任何位置。注釋行被QIIME 2忽略,僅供參考。不支持行內注釋(類似代碼中使用的行末注釋)。

空行(例如空行或僅由空單元格組成的行)可能出現在文件中的任何位置,並被忽略。

標識符列

Identifier Column

元數據文件中的第一列是標識符(ID)列。此列定義與您的研究關聯的樣本或功能ID。不建議在單個元數據文件中混合樣本和功能ID;將樣本和功能元數據存儲在單獨的文件中。

ID列名(即ID行開頭)必須是以下值之一。下面列出的值不能用於命名文件中的其他ID或列。

不區分大小寫:

id

sampleid

sample id

sample-id

featureid

feature id

feature-id

大小寫敏感的以下樣品列名,兼容QIIME 1、Biom格式和QITTA

- #SampleID
- #Sample ID
- #OTUID
- #OTU ID
- sample_name

ID(樣品名)命名的規則:

ID可以由任何Unicode字符組成,但不能以井號(#)開頭,因為這些行將被解釋為注釋並被忽略。

有關在研究中選擇標識符的建議,請參閱下方標識符建議一節。

ID不能為空(即,它們必須至少包含一個字符)。

ID必須唯一(執行精確的字符串匹配以檢測重複項)。

文件中必須至少存在一個ID。

ID不能使用上面列出現過的任何保留ID列名稱。

標識符的建議

Recommendations for Identifiers

QIIME 2的目標是在元數據文件的所有單元格中支持任意Unicode字符。但是,考慮到任何人都可以開發QIIME 2插件和接口,我們不能保證任意Unicode字符可以與所有插件和接口一起使用。因此,我們可以向用戶推薦在標識符中應該安全使用的字符,並且我們正在為插件和接口開發人員準備資源,以幫助他們的軟體儘可能兼容性更好(robust, 穩定)。當開發人員資源可用時,我們將在QIIME 2論壇的開發人員討論欄目中宣布。

帶有問題字符的樣本和功能標識符往往會給我們的用戶帶來最常碰到的問題。根據我們對QIIME 1、QIIME 2以及其他生物信息學和命令行工具的經驗,我們可以為標識符推薦以下屬性:

標識符的長度應不超過36個字符;

標識符只能包含ASCII字母數字字符(即[A-Z]、[A-Z]或[0-9]範圍內)、句點(.)字符或短劃線(-)字符;

(儘可能僅使用字母數字組合,且僅以字母開頭,可兼容更多分析工具)

要記住的一個重要點是,有時示例元數據中的值可以成為標識符。

例如,分類法注釋可以在qiime taxa collapse後成為特徵標識符,而示例或特徵元數據值可以在應用qiime feature-table group後成為標識符。

如果您計劃在元數據值可以成為標識符的地方應用這些或類似的方法,那麼如果這些值也符合這些標識符建議,您將不太可能遇到問題。

為了幫助用戶了解這些建議,Keemi元數據驗證器將警告用戶不符合上述建議的標識符。

用戶可能對cual-id(https://msystems.asm.org/content/1/1/e00010-15 原作者開發的一款樣本命名軟體)軟體感興趣,以幫助創建樣本標識符cual-id文件還提供了一些關於如何設計標識符的討論。

注: 一些生物信息學工具對標識符的要求可能比這裡概述的建議更嚴格。例如,Illumina示例表標識符不能具有點.字符,而我們在推薦的字符集中包含這些字符,尤其是使用USEARCH軟體時樣本名不能有點,因為點是樣本名與序列ID的分割符。同樣,phylip要求標識符最多為10個字符,而我們建議長度不超過36個字符。如果計劃導出數據,在對標識符有更嚴格要求的其他工具在分析,我們建議您在QIIME 2分析中也遵循這些要求,以簡化後續處理步驟。

注: 這裡建議的長度(36個字符或更少)設計為儘可能短,同時仍然支持用破折號格式化的UUID版本4。

元數據列

Metadata Columns

ID列是元數據文件中的第一列,可以選擇後面跟隨定義與每個樣本或功能ID關聯元數據的附加列。元數據文件不需要具有附加的元數據列,因此僅包含ID列的文件是有效的QIIME 2元數據文件。

以下規則適用於列名:

以下規則適用於列值:

注意: 空單元格只表示缺失數據,但不表示可能缺失哪種類型的數據。您可以使用您選擇的其他值來表示不同類型的缺失數據(例如,「不適用not applicable」與「未收集not collected」)。這些自定義值不會被解釋為QIIME 2中的缺失數據,但在進一步分析之前,您仍然可以記錄並使用這些「缺失」的元數據值對數據執行篩選(例如,使用QIIME功能表篩選樣本可根據自定義「缺失」值篩選樣本)。

列類型

Column Types

QIIME 2目前支持分類和數字元數據列。默認情況下,QIIME 2將嘗試推斷每個元數據列的類型:如果該列僅包含數字或缺少的數據,則該列將被推斷為數字。否則,如果列包含任何非數字值,則該列將被推斷為分類列。分類列和數字列都支持缺失數據(即空單元格)。

QIIME 2支持可選的comment指令,允許用戶顯式地聲明列的類型,避免了上面描述的列類型推斷。如果有一列看起來是數字的,但實際上應被視為分類元數據(例如樣品分組列,其中分組類型被標記為1、2、3會被當時數值列),則這一點很有用顯式聲明列的類型也會使元數據文件更具描述性,因為預期的列類型包含在元數據中,而不是依賴軟體來推斷類型(這並不總是透明的)。

可以使用可選的comment指令在元數據文件中聲明列類型。comment指令必須出現在表頭的正下方。該行的第一個單元格必須是#q2:types,以指示該行是注釋指令。後續單元格可以包含類別值categorical或數字值numeric(大小寫均可)。如果不希望將類型賦給列(在這種情況下將推斷該類型),也支持空單元格。因此,在不必為元數據中的每一列聲明類型的情況下,很容易包含此comment指令。

小提示:使用QIIME元數據表查看QIIME 2元數據的列類型。無論您使用的是comment指令、類型推斷還是這兩種方法的組合,這都是有效的。

注意: 在QIIME 2和QIIME 1的早期版本中,元數據列通常被稱為元數據類別。既然我們支持元數據列類型化,這允許您判斷一個列是否包含數字或分類數據,那麼我們最終將使用諸如分類元數據類別或數字元數據類別之類的術語,這可能會令人困惑。我們現在避免使用術語category,除非它在分類元數據的上下文中使用。我們已經盡了最大努力更新了我們的軟體和文檔,以使用元數據列(metadata column)的叫法而不是元數據類別(metadata category),但是仍然可能會有以前的研究中使用此類名稱。

注意
#q2:types comment指令是唯一支持的comment指令;其他指令可能會在將來添加(例如q2:units)。因此,不允許以#q2:開頭的行,因為我們將保留該命名空間以供將來的注釋指令使用。

數字格式化

Number Formatting

如果要將列解釋為數字元數據列(通過列類型推理或使用#q2:types 注釋指令指定),則必須按照以下規則格式化列中的數字:

使用十進位數字系統:

ASCII字符[0-9],.對於可選的小數點,和+和-分別表示正負號。

科學記數法可與數字記數法一起使用;

支持e和E

總共只支持15位數字(包括小數點前後),以保持在64位浮點規範內。

總數超過15位的數字不受支持,將導致未定義的行為

不支持非數字(例如 NaN、nan)或無窮大(例如 Inf、-Infinity)的常用表示。

對丟失的數據使用空單元格(而不是NaN)。

此時在QIIME 2元數據文件中不支持無窮大。

高級文件格式詳細信息

Advanced File Format Details

註:如果使用電子表格程序(如Microsoft Excel、Google Sheets)創建和導出QIIME 2元數據文件,則通常不需要本節中的詳細信息。如果您手工創建TSV文件(例如在文本編輯器中),或者編寫自己的軟體來使用或生成QIIME 2元數據文件,那麼本節中的詳細信息可能很重要,請繼續閱讀!

TSV行話和語法分析器

TSV Dialect and Parser

QIIME 2嘗試與從Microsoft Excel導出的TSV文件進行互操作,因為這是我們在使用中看到的最常見的TSV「行話」。QIIME 2元數據解析器(即讀取器)使用python csv模塊excel tab方言來解析TSV元數據文件。此方言支持雙引號字符(「)包裝欄位,以允許欄位中包含制表符、換行符和回車符。要在欄位中包含文本雙引號字符,雙引號字符必須緊跟在另一個雙引號字符之前。有關Excel選項卡方言的完整文檔,請參閱python csv模塊。

編碼和行尾

Encoding and Line Endings

元數據文件必須編碼為UTF-8,這與ASCII編碼向後兼容。
為了實現互操作性,元數據分析器都支持Unix行尾(\n)、Windows/DOS行尾(\r\n)和「經典Mac OS」行尾(\r)在QIIME 2中將元數據文件寫入磁碟時,行尾將始終為\r\n(Windows/DOS行尾)

尾隨的空單元格和交錯數據

Trailing Empty Cells and Jagged Data

元數據分析器忽略出現在由頭聲明的欄位之後的任何尾隨的空單元格。這主要是為了與從一些電子表格程序導出的文件進行互操作。這些尾隨的單元格/列可能參差不齊(或整齊);在讀取文件時,它們將被忽略。

如果一行不包含標題聲明的欄位,則將填充空單元格以匹配標題長度(同樣,這主要是為了與導出的電子表格進行互操作)。

譯者註:元數據編寫注意事項

為了方便分析,對樣品的描述必須包括一些基本信息和格式規範,QIIME2中實驗設計/元數據mapping file/metadata基本要求如下:

文件必須是制表符分隔的純文本文件,建議使用Excel編輯並複製到純文本編輯器(如editplus, ultraedit等)中保存為UTF-8編碼的txt格式;

注釋行以#開頭,可以出現在文中任意位置,程序會自己忽略;

空行也會被忽略;

第一行為表頭,與QIIME1相比不再以#開頭,更合理;

表頭每列名稱必須唯一,不能包括標點符號; 建議實驗設計只使用字母和數字,任何符號在後續分析都可能會有問題

文件至少包括除表頭外的一行數據;

第一列為樣品名,用於標識每個樣品,名字必須唯一。

具體實例,可參考:

使用元數據

Using Metadata Files

mkdir qiime2-metadata-tutorial
cd qiime2-metadata-tutorial

# 下載示例樣本信息
wget \
-O "sample-metadata.tsv" \
"https://data.qiime2.org/2019.7/tutorials/moving-pictures/sample_metadata.tsv"

由於這是一個TSV文件,它可以在各種應用程式中打開和編輯,包括文本編輯器、Microsoft Excel和Google工作表(例如,如果您計劃使用Keemi驗證元數據)。
QIIME 2還提供了一個可視化工具,用於查看交互表中的元數據:

qiime metadata tabulate \
--m-input-file sample-metadata.tsv \
--o-visualization tabulated-sample-metadata.qzv

此文件網頁中支持排序,篩選。

問題
根據表tabulated-sample-metadata.qzv中的表格,有多少樣本與subject-1相關?有多少樣本與gut腸道部位有關?提示:使用搜索框和/或列排序選項來幫助執行此查詢。

使用QIIME2對象作為元數據

Using QIIME 2 Artifacts as Metadata

除了TSV元數據文件之外,QIIME 2還支持將某些類型的對象作為元數據。這方面的一個例子是SampleData[AlphaDiversity]類型的對象。

要開始將對象理解為元數據,首先下載一個示例對象:

詳者註:微生物組分析的Alpha、Beta多樣性值,在本質上,也是樣本的一種屬性,可加入元數據表中,方便後續分析。

# 下載Alpha多樣性PD算法的結果
wget \
-O "faith_pd_vector.qza" \
"https://data.qiime2.org/2019.7/tutorials/metadata/faith_pd_vector.qza"

要將此對象視為元數據,只需將其傳遞給希望看到元數據的任何方法或可視化工具(例如,metadata tabulate或emperor plot):

qiime metadata tabulate \
--m-input-file faith_pd_vector.qza \
--o-visualization tabulated-faith-pd-metadata.qzv

輸出對象

faith_pd_vector.qza:

多樣性元數據可視化。

查看 | 下載

可視化對象


圖中的樣本新增了對應pd多樣性值

問題:Faith’s PD的最大值是多少?最小值是多少?提示:使用列排序功能。

問題:qzv文件包括結果生成的過程,請查看該結果的追溯圖,研究分析過程。

合併原數據

Merging metadata

由於元數據可以來自許多不同的源,因此在運行命令時,QIIME 2支持元數據合併。基於上面的示例,只需多次傳遞--m-input-file就可以將元數據列組合到指定的文件中

qiime metadata tabulate \
--m-input-file sample-metadata.tsv \
--m-input-file faith_pd_vector.qza \
--o-visualization tabulated-combined-metadata.qzv

合併後生成的元數據將包含所有指定文件中標識符的交集。換句話說,合併的元數據將只包含在所有提供的元數據文件中共享的標識符。這是一個使用資料庫術語的內部聯接。

問題: 修改上面的命令,將SampleData[AlphaDiversity]的均勻度向量(evenness vector)合併到Faith’s PD向量之後。合併三個對象時會發生什麼?結果元數據可視化中有多少列?這些列中有多少列表示樣本ID?這些列中有多少列表示SampleData[AlphaDiversity]度量?如果元數據文件的順序顛倒了,可視化會發生什麼?提示,仔細查看列順序。

在QIIME 2中接受元數據的任何地方都支持元數據合併。例如,根據研究元數據或樣本alpha多樣性為Emperor plot著色可能很有意思。這可以通過提供樣本元數據文件和SampleData[AlphaDiversity]對象來實現:

# 組合Alpha和Beta多樣性
wget \
-O "unweighted_unifrac_pcoa_results.qza" \
"https://data.qiime2.org/2019.7/tutorials/metadata/unweighted_unifrac_pcoa_results.qza"

qiime emperor plot \
--i-pcoa unweighted_unifrac_pcoa_results.qza \
--m-metadata-file sample-metadata.tsv \
--m-metadata-file faith_pd_vector.qza \
--o-visualization unweighted-unifrac-emperor-with-alpha.qzv

輸出對象

可視化對象

可以按Alpha多樣性進行PCoA的著色了,這樣探索更有意思

問題:哪一類取樣位置有最高的Faith’s進化多樣性值?

提示:查看中使用按body site上色,再按Faith's PD連續著色,兩圖並列比較試試;

探索特徵元數據

Exploring feature metadata

wget \
-O "rep-seqs.qza" \
"https://data.qiime2.org/2019.7/tutorials/metadata/rep-seqs.qza"
wget \
-O "taxonomy.qza" \
"https://data.qiime2.org/2019.7/tutorials/metadata/taxonomy.qza"

qiime metadata tabulate \
--m-input-file rep-seqs.qza \
--m-input-file taxonomy.qza \
--o-visualization tabulated-feature-metadata.qzv

輸出對象

taxonomy.qza:

物種注釋結果文件。

查看 | 下載

rep-seqs.qza:

代表序列。

查看 | 下載

可視化對象

現在已經將序列ID、序列物種注釋和置信度合併一起展示了。

問題:所有.qza都是可查看的元數據嗎?使用qiime metadata tabulate自己試試吧。

最後,在元數據表生成的可視化中有可用的導出選項。使用tabulated-feature-metadata.qzv的結果,將數據導出為新的tsv。在TSV查看器或文本編輯器中打開該文件,並注意內容與可視化中的交互式元數據表相同。

問題:是否可以將上述步驟中導出的TSV用作元數據?能夠導出元數據有哪些好處(提示:請參閱上面關於元數據合併的討論)?關於一些潛在的缺點(提示:當數據從QIIME 2導出時,數據來源會發生什麼情況)?

譯者註:網頁中查看可以導出任意格式的結果、並可追溯實驗的分析過程、支持篩選、查找和排序。導出後分析過程將不可追溯。

Reference

https://docs.qiime2.org/2019.7

Evan Bolyen, Jai Ram Rideout, Matthew R. Dillon, Nicholas A. Bokulich, Christian C. Abnet, Gabriel A. Al-Ghalith, Harriet Alexander, Eric J. Alm, Manimozhiyan Arumugam, Francesco Asnicar, Yang Bai, Jordan E. Bisanz, Kyle Bittinger, Asker Brejnrod, Colin J. Brislawn, C. Titus Brown, Benjamin J. Callahan, Andrés Mauricio Caraballo-Rodríguez, John Chase, Emily K. Cope, Ricardo Da Silva, Christian Diener, Pieter C. Dorrestein, Gavin M. Douglas, Daniel M. Durall, Claire Duvallet, Christian F. Edwardson, Madeleine Ernst, Mehrbod Estaki, Jennifer Fouquier, Julia M. Gauglitz, Sean M. Gibbons, Deanna L. Gibson, Antonio Gonzalez, Kestrel Gorlick, Jiarong Guo, Benjamin Hillmann, Susan Holmes, Hannes Holste, Curtis Huttenhower, Gavin A. Huttley, Stefan Janssen, Alan K. Jarmusch, Lingjing Jiang, Benjamin D. Kaehler, Kyo Bin Kang, Christopher R. Keefe, Paul Keim, Scott T. Kelley, Dan Knights, Irina Koester, Tomasz Kosciolek, Jorden Kreps, Morgan G. I. Langille, Joslynn Lee, Ruth Ley, Yong-Xin Liu, Erikka Loftfield, Catherine Lozupone, Massoud Maher, Clarisse Marotz, Bryan D. Martin, Daniel McDonald, Lauren J. McIver, Alexey V. Melnik, Jessica L. Metcalf, Sydney C. Morgan, Jamie T. Morton, Ahmad Turan Naimey, Jose A. Navas-Molina, Louis Felix Nothias, Stephanie B. Orchanian, Talima Pearson, Samuel L. Peoples, Daniel Petras, Mary Lai Preuss, Elmar Pruesse, Lasse Buur Rasmussen, Adam Rivers, Michael S. Robeson, Patrick Rosenthal, Nicola Segata, Michael Shaffer, Arron Shiffer, Rashmi Sinha, Se Jin Song, John R. Spear, Austin D. Swafford, Luke R. Thompson, Pedro J. Torres, Pauline Trinh, Anupriya Tripathi, Peter J. Turnbaugh, Sabah Ul-Hasan, Justin J. J. van der Hooft, Fernando Vargas, Yoshiki Vázquez-Baeza, Emily Vogtmann, Max von Hippel, William Walters, Yunhu Wan, Mingxun Wang, Jonathan Warren, Kyle C. Weber, Charles H. D. Williamson, Amy D. Willis, Zhenjiang Zech Xu, Jesse R. Zaneveld, Yilong Zhang, Qiyun Zhu, Rob Knight & J. Gregory Caporaso#. Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2. Nature Biotechnology. 2019, 37: 852-857. doi:10.1038/s41587-019-0209-9

譯者簡介

劉永鑫,博士。2008年畢業於東北農大微生物學,2014年於中科院遺傳發育所獲生物信息學博士,2016年博士後出站留所工作,任宏基因組學實驗室工程師。目前主要研究方向為宏基因組數據分析和植物微生物組,QIIME 2項目參與人。目前在Science、Nature Biotechnology等雜誌發表論文十餘篇。2017年7月創辦「宏基因組」公眾號,目前分享宏基因組、擴增子原創文章400餘篇,代表博文有《擴增子圖表解讀、分析流程和統計繪圖三部曲(21篇)》、《Nature綜述:手把手教你分析菌群數據(1.8萬字)》、《QIIME2中文教程(18篇)》等,關注人數6.5萬+,累計閱讀1000萬+。

猜你喜歡

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組  宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人

一文讀懂:宏基因組 寄生蟲益處 進化樹

必備技能:提問 搜索  Endnote

文獻閱讀 熱心腸 SemanticScholar Geenmedical

擴增子分析:圖表解讀 分析流程 統計繪圖

16S功能預測   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在線工具:16S預測培養基 生信繪圖

科研經驗:雲筆記  雲協作 公眾號

編程模板: Shell  R Perl

生物科普:  腸道細菌 人體上的生命 生命大躍進  細胞暗戰 人體奧秘  

寫在後面

為鼓勵讀者交流、快速解決科研困難,我們建立了「宏基因組」專業討論群,目前己有國內外5000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入群,務必備註「姓名-單位-研究方向-職稱/年級」。PI請明示身份,另有海內外微生物相關PI群供大佬合作交流。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍未解決群內討論,問題不私聊,幫助同行。

學習16S擴增子、宏基因組科研思路和分析實戰,關注「宏基因組」

點擊閱讀原文,跳轉最新文章目錄閱讀

相關焦點

  • QIIME 2用戶文檔. 10元數據Metadata(2018.11)
    前情提要QIIME 2用戶文檔. 9元數據Metadata in QIIME 2https://
  • QIIME 2教程. 11元數據Metadata(2020.11)
    QIIME 2用戶文檔. 11元數據Metadata in QIIME 2https://docs.qiime2
  • QIIME 2教程. 11元數據Metadata(2020.2)
    前情提要以下是前面幾節的微信推送文章:QIIME 2用戶文檔. 11元數據Metadata in QIIME 2
  • QIIME 2教程. 20實用程序Utilities(2020.11)
    import 導入數據Import data into a new QIIME 2 Artifact. inspect-metadata 檢查元數據列Inspect columns available in metadata.
  • QIIME 2教程. 15樣品分類和回歸q2-sample-classifier(2020.11)
    q2-sample-classifierhttps://docs.qiime2.org/2020.11/tutorials/sample-classifier/註:q2-sample-classifier參考文檔中提供了通過Python API和命令行界面使用所有插件操作的文檔。
  • QIIME 2用戶文檔. 3老司機上路指南(2019.7)
    >https://docs.qiime2.org/2019.7/tutorials/qiime2-for-experienced-microbiome-researchers/正文共:7000 字 0 圖 1 視頻預計閱讀時間:17 分鐘,視頻時長 14 分鐘更新時間:2019年8月17日本節我們將介紹如何使用QIIME 2處理微生物數據
  • QIIME 2教程. 22命令行界面q2cli(2020.11)
    https://docs.qiime2.org/2020.11/interfaces/q2cli/註:最好按本教程順序學習,想直接學習本章,至少完成本系列《1簡介和安裝》。本指南介紹了q2cli,它是QIIME 2 Core發行版中包含的QIIME 2命令行界面。教程廣泛使用q2cli,因此建議在開始教程之前先閱讀本文檔。本文檔尚在開發中,將來會擴展。基本用法 Basic usageq2cli包含一個qiime命令,該命令用於從命令行執行QIIME分析。
  • QIIME 2教程. 05糞菌移植分析練習Fecal microbiota transplant (FMT)(2020.2)
    前情提要以下是前面幾節的微信推送文章:QIIME 2用戶文檔. 5糞菌移植分析練習Fecal microbiota
  • QIIME 2教程. 02插件工作流程Plugin Workflows(2020.11)
    註:在閱讀此文前您應先了解QIIME 2的專業術語,請訪問 https://docs.qiime2.org/2020.11/glossary/ 開始閱讀。👺註:本節是QIIME 2用戶新手的指南,特別適用於那些不熟悉微生物組研究的用戶。對於已經精通微生物組分析的有經驗用戶可跳過本節,直接閱讀下一節《老司機上路指南》。
  • QIIME 2教程. 25可用和開發中插件AvailableFuturePlugins(2020.11)
    可用插件Available pluginshttps://docs.qiime2.org/2020.11
  • 微生物組分析軟體 QIIME 2 安裝小記
    QIIME 2 是一個功能強大,可擴展,分散式的(decentralized)微生物組分析軟體包,專注於數據和分析透明度。 QIIME 2 使研究人員能夠從原始 DNA 序列數據開始進行分析,最終得到以符合出版物標準的圖形數據和統計結果。主要特點:QIIME 2 是對 QIIME 1 微生物組分析流程完全重新設計和重寫而來的。
  • 擴增子分析QIIME2. 1簡介和安裝
    由中科院遺傳發育所劉永鑫博士翻譯並親測有效,文檔翻譯己獲QIIME2團隊官方授權。https://forum.qiime2.org/t/qiime2-1-chinese-manual/838如中文翻譯沒有急時更新,新閱讀英文原版 https://docs.qiime2.org本人只習慣使用命令行模式分析數據,圖形界面和Ipython模式下使用暫不介紹。本系列的教程主要以命令行方式為大家演示。
  • Linux系統和Shell命令行簡介,走上數據分析之路
    本節作者:劉永鑫 中國科學院遺傳與發育生物學研究所版本1.0.2,更新日期:2020年8月31日本項目永久地址:https://github.com/YongxinLiu/MicrobiomeStatPlot ,本節目錄 122Linux,包含R markdown(*.Rmd)、Word(*.docx)文檔、測試數據和結果圖表,歡迎廣大同行幫忙審核校對、並提出修改意見
  • 究竟是哪個會話造成了"Waiting for table metadata lock"等待
    曾經是否有遇到過,資料庫出現一大片的」Waiting for table metadata lock「元數據鎖等待,但是卻不知道到底是哪個會話佔有了該對象的元數據鎖
  • 【用戶痕跡在電子數據取證實戰中的應用】
    由於痕跡產生於用戶使用計算機等設備的過程中,因此還具備著記錄用戶操作歷史、行為軌跡、通信記錄、密碼信息等隱私數據的特點。用戶使用計算機、手機、平板電腦等設備都會產生用戶痕跡。用戶在常規的文檔類工作中會產生很多的痕跡數據,包括lnk文件、Metadata(元數據)、Thumbnail(縮略圖)、回收站、網絡信息等。
  • QIIME2教程. 03老司機上路指南Experience(2020.11)
    https://docs.qiime2.org/2020.11/tutorials/qiime2-for-experienced-microbiome-researchers/正文共:7000 字 0 圖 1 視頻預計閱讀時間:17 分鐘,視頻時長 14 分鐘更新時間:2020年12月13日本節我們將介紹如何使用QIIME 2處理微生物數據
  • 使用編譯器——Solidity中文文檔(8)
    //   metadata - 元數據    //   ir - 去除語法糖(desugaring)之前的新彙編格式    //   evm.assembly - 去除語法糖(desugaring)之後的新彙編格式    //   evm.legacyAssembly - JSON的舊樣式彙編格式    //   evm.bytecode.object - 字節碼對象
  • 電子文檔真實性鑑定之PDF文件元數據
    PDF編輯器軟體Adobe Acrobat,或者元數據查看軟體ExifTool,對PDF文件的元數據信息進行查看或者直接使用電子數據編輯軟體Winhex直接查看PDF文件的十六進位代碼或ANSI ACSII代碼那麼,PDF文件的元數據信息有什麼用了?
  • 極光:2019年11月個人網盤行業月度活躍用戶超1億
    根據極光的統計結果,個人網盤行業安裝滲透率由2018年11月的20.2%上升至2019年11月的22.1%,增長1.9個百分點。同時,月度活躍用戶2019年下半年持續上升,11月達1.065億,在全國手機上網用戶規模保持平穩的情況下,進一步提升個人網盤的滲透率和擴大家庭用戶規模或是個人網盤行業發展的關鍵。
  • 蘋果內部文檔揭示 2019 款 iPhone 11 Pro Max 等新品信息
    蘋果內部文檔揭示 2019 款 iPhone 11 Pro Max 等新品信息 站長之家(ChinaZ.com) 9 月 4 日消息:根據最新洩露的疑似蘋果的內部文檔顯示