不知道各位從事或即將從事微生物群落功能生態學研究的大蝦有沒有留意到,通過功能基因擴增子測序技術研究微生物群落功能的文章一般多會將測序獲得的核酸序列通過特定軟體翻譯成胺基酸序列後,再進行聚類、組成、比較、差異、關聯和進化等一系列分析。
比如這篇文章:
DOI:10.1038/ismej.2017.97
或者這篇:
DOI:10.3389/fmicb.2016.01894
又或者這篇:
DOI:10.1111/1462-2920.12366
那麼問題來了,為什麼功能基因擴增子測序可(hai)以(yao)使用胺基酸序列做分析呢?原因有如下幾點:
嵌合體序列
測序帶來的插入/缺失導致的移碼突變(Frame shift)
包含終止子的序列
非目的功能基因序列
因此,功能基因使用胺基酸序列分析相較於使用核酸序列分析優勢盡顯!
下面小美就給大家隆重介紹一下美吉結合科研前沿自主研發的功能基因使用胺基酸序列分析的最新產品吧!
原始數據質控拼接後獲得核酸序列優化數據既可以上傳I-Sanger平臺直接進行36項含金量十足的交互分析;也可將核酸優化序列可以翻譯成胺基酸序列,後續以胺基酸序列為數據基礎分別進行Unique胺基酸序列分析和OPU聚類分析等32項前沿的線下功能基因使用胺基酸分析。
Unique胺基酸序列:使用Framebot軟體將核苷酸序列翻譯成胺基酸序列後,去除完全重複後的胺基酸序列,直接用於物種注釋和OPU聚類分析。
OPU:即Operational Protein Unit,將Unique胺基酸序列按照一定的相似性閾值進行聚類後獲得的功能分類單元,挑選每一類中豐度最高的胺基酸序列作為該OPU的代表序列並進行後續各類分析。
指數組間差異檢驗分析通過比較不同組間指數的差異顯著性,進而評估不同組間微生物群落的豐度和多樣性差異。每條柱子代表一個分組。兩組樣本比較結果(左圖),多組樣本比較結果(右圖)。
選取高豐度或感興趣的關鍵OPU,在PCA分析的基礎上增加OPU信息,比較該OPU在各樣本中的多度(多度指群落中功能分類的頻率分布)排序情況。由不同的樣本向各OPU箭頭做垂線,如果樣本的投影點在箭頭的反向延長線上,則表示該OPU在此樣本中內多度小於平均值;反之,則大於平均值。
通過VPA分析,土壤性質(ENV)與地理因素(GEOL)兩類環境因子各自單獨對微生物群落變化的解釋度分別為1%和23%,二者共同的解釋度為12%,兩者未解釋的比例是64%。
OPU相關性網絡圖中藍色節點表示OPU,節點的大小表示OPU的相對豐度大小。兩個節點間連接有線段時,表示這兩個OPU存在一定的相關性,紅色表示正相關,綠色表示負相關。
選取特定OPU代表序列,並調取該序列在相應功能基因資料庫中的Best hit序列共同構建系統發育進化樹,進化樹中每條樹枝代表一個物種或OPU。進化分枝上的OPU後的括號中的數字為該OPU的豐度信息,物種進化分枝上後的括號中的數字為該物種對應序列的Accession Number。樹枝上數字為bootstrap值。
上面只是簡單介紹了一下功能基因多樣性研究的分析流程,小美將會在10月第一個工作周組織舉辦《功能基因多樣性測序研究簡介》專場講座,與各位一起分享功能基因多樣性研究的前沿進展,功能基因具體的實驗、分析策略和注意事項,以及美吉在功能基因多樣性產品上的優勢。如果您對我們的後續講座感興趣的話,歡迎您使用手機微信掃描下方的二維碼關注公眾號「美吉生物」,第一時間獲取更多在線講座的發布信息。