本報訊(記者彭科峰)日前,中科院新疆理化所王延斌在尤著宏研究員指導下,提出一種使用蛋白質序列信息預測蛋白質相互作用的計算方法。相關成果發布於《國際分子科學雜誌》。
隨著蛋白質相互作用實驗技術的發展,人們能夠獲得大量的蛋白質相互作用數據,甚至能夠在全基因組範圍內對蛋白質相互作用進行分析。然而,由於實驗技術的限制,很多高通量實驗方法測得的蛋白質相互作用數據的錯誤率都比較高。此外,傳統實驗的方法不適用於檢測大規模數據。
為了獲得重要的蛋白質信息,科研人員首先使用位置打分矩陣(PSSM)去表示每一個蛋白質序列。研究發現,打分矩陣的表示方法不僅保留了序列的位置信息,還保留了蛋白質的化學信息。同時,為了開發PCVMZM預測模型,科研人員首先在不同尺度的PSSM打分矩陣上提取到準確的、有代表性的蛋白質信息,並將每一個信息表示成一個特徵向量作為特徵,運用一個強分類器去預測蛋白質的交互。
研究結果表明,此方法能夠提供精確、穩定、覆蓋率高的預測信息,為基因組學研究提供了一個有用的決策工具。
《中國科學報》 (2017-08-01 第4版 綜合)