今天小編給大家帶來的這篇文獻分享是2020-05-04發表在Nature Communications(IF:12.121)上的一篇文章,題目為Comprehensive aptamer-based screening identifies a spectrum of urinary biomarkers of lupus nephritis across ethnicities。在正式的文章介紹開始之前呢,小編想和大家分享一下關於Nature雜誌社文章偏好類型的問題。自從2018年7月,前任Nature Communications主編Magdalena Skipper成為Nature雜誌社的主編後(順便說一句,Skipper博士是Nature創刊以來的第一屆女性主編),所有Nature雜誌社旗下的期刊文章都開始更加偏好大數據測序加生物信息學分析類型的文章,所以以後大家如果生物信息學分析的文章可以嘗試著往Nature雜誌社投稿,畢竟投其所好嘛!好啦,閒話說完,咱們開始介紹文章啦!
研究背景
狼瘡性腎炎(LN)是系統性紅斑狼瘡(SLE)最常見的併發症,且10-15%的LN患者會進展成終末期腎病。而目前對於LN的診斷標準主要以腎臟活檢為主,但是因為腎活檢技術的難度性以及取檢的組織可能無法代表整個腎臟的病理進展,因此亟待更快速更靈敏的生物標記物診斷指標的出現。
材料與方法
選取了23位女性(年齡23-46歲)的尿液樣本,其中7例為LN,8例為SLE但不伴隨腎臟病變以及8例健康對照,並將這些尿液樣本進行基於適配體的蛋白質測序。那麼何為基於適配體的蛋白質測序呢?我們知道目前蛋白質組學測定基本上使用高通量質譜技術,但是它存在一定的問題,就是高豐度蛋白會掩蓋掉很多低豐度的蛋白,導致結果出現偏差。因此本文採用了基於適配體的蛋白質測序,其原理簡單地說是利用磁珠經過兩輪洗脫最後對和蛋白質結合上的適配體進行測序,然後定量。由於其檢測濃度極值可以達到1.6pg/ml,所以對於低豐度蛋白也可以有很好的檢出效果。
結果
1. LN患者適配體蛋白質測序結果及分析
研究人員將1129個蛋白適配體標記的磁珠加入測試尿液樣本中,通過兩步洗脫後得到的適配體進行DNA測序,並且將數據與尿肌酐水平進行比對從而標準化。結果顯示LN與SLE不伴隨腎臟病變組比較,有284個蛋白水平明顯上升;SLE與正常對照組比較,有326個蛋白水平明顯上升(FIG1A)。而後他們把LN組上升的蛋白進行pathway通路富集,發現主要涉及幾個模塊,例如炎症通路和信號分子通路(FIG1B)以及補體蛋白通路(FIG1C)。為了驗證上述蛋白質組學結果是否存在較大的組內差異,他們將升高最明顯的50個蛋白(以fold-change從大到小排列)變成個體表達矩陣,發現確實這50個蛋白表達LN組普遍升高(FIG1D)。為了確定這50個蛋白的預測效率,他們採用了隨機森林算法分析,使用外部數據集作測試組別,得出了分類功能最好的20個蛋白(FIG1E)。這裡小編覺得不是說50個蛋白只有20個有分類功能,很可能是外部數據中並沒有完全包含這50個蛋白,而且他這個分析的主要想法還是想看一下這些蛋白是否真的具有分類功效,最後是否能稱為biomarkers還是要看後續驗證的。
2. 在獨立隊列中對上述結果進行ELISA驗證
對上述挑選出的50個蛋白進行ELISA驗證。驗證隊列包含36個病例(12例LN,12例SLE不伴隨腎臟疾病以及12例正常對照)。首先他們剔除了21個蛋白(包括測序時相對表達值較低的蛋白,已經被作為標記物進行研究的蛋白和與其他蛋白相關性都很高的蛋白),然後對剩餘的29個蛋白進行ELISA檢測。發現12個蛋白在LN組中顯著升高(在補充結果中)。因為考慮到LN的種族差異性,所以在一個包含非洲裔美國人和高加索人的新隊列中,再次對這12個蛋白進行驗證(FIG2)。可以看出這些蛋白在不同種族確實存在表達的差異。而後研究者對這12個蛋白進行ROC分析來看其預測效能(Table3)。考慮到種族和其他因素對蛋白表達可能存在幹擾,因此將幹擾因素加入後進行校準分析(Table4)。
3. 多蛋白聯合預測模型及隊列驗證
上述結果顯示了單個蛋白作為生物標記物的預測結果,而後研究者利用LASSO回歸模型,觀察多蛋白聯合臨床變量預測模型的效能(FIG4A),臨床變量包括種族、年齡和強的松使用。結果顯示最佳預測模型包括8個蛋白加上種族變量,此模型ROC曲線下面積0.98,預測效能最佳。這個結果讓研究者堅定認為種族是LN中的一個極其重要的影響因素。因此他們利用一個亞洲人群的新隊列對FIG2中標記物蛋白在非洲裔美國人和高加索人中表達一致的8個蛋白進行了再次驗證(FIG3B),這個隊列還包含了無狼瘡腎炎的患者(Active NR)。
4. 標記物蛋白與LN臨床信息及實驗室檢驗的相關性分析研究
在確定了標記物蛋白在跨種族的表達差異後,研究者又將這12個標記物蛋白與三個隊列中不同種族人群的臨床信息和實驗室檢驗結果做了一個相關性分析(FIG4A)。而後他們利用貝葉斯網絡模型來推測所有變量的相互依賴型及概率分布(FIG4B)。結果提示ALCAM及sE-Selectin對臨床分型和臨床評分影響最大。
5. 標記物蛋白在LN患者腎臟中的表達情況
因無法確定標記物蛋白來源自循環血液還是腎臟,研究者對LN患者腎活檢組織進行了單細胞測序,細胞群落分布(FIG5B)及標記物蛋白來源細胞分布(FIG5A)結果顯示CCL2(MCP-1)、VCAM1、CAST(Calpastatin)及FCGR2B(FcgRIIIBC)在腎臟中表達差異最顯著(FIG5C)。
討論
這篇文章通過蛋白組學確定了狼瘡性腎炎患者的尿液蛋白生物標記物,並且通過多隊列驗證,明確了生物標記物蛋白存在跨種族差異。整體來說,文章主體的故事講的還是比較完整的,邏輯線也都比較完整的,美中不足的是(應該屬於雞蛋裡挑骨頭),隊列樣本的數量相對來說較少,如果真的要明確這些蛋白是否能夠成為未來的診斷標記物,還是需要大樣本數量的隊列研究進行驗證的。
那麼今天的分享就到這兒啦,謝謝大家!