在空間生物學中,我們可以預期將AI應用於基因或蛋白質活性的逐細胞圖譜將為重大發現鋪平道路。
最近出現了許多關於AI有關於細胞和組織空間生物學的知識,組織是細胞的異質混合物。這在疾病中尤其重要。細胞也是生命的基本單位,它們由鄰近它們的那些細胞形成。毫不奇怪,該研究領域試圖調查細胞和組織的異質性。過去十年見證了單細胞測序RNA的廣泛採用。這種方法要求我們分解細胞,從而對細胞群體進行核算和表徵,但同時失去它們的空間背景,例如它們與其他細胞的鄰近性或適合傳統方法(例如組織病理學)的位置。
輸入空間基因組學
這就是為什麼我們歡迎空間轉錄組學,並致力於將RNA轉錄本定位到它們在組織中的位置。畢竟,了解疾病病理學不僅需要我們了解基本的基因組學和轉錄組學,還需要了解細胞及其在組織中的相對位置之間的關係。研究癌症,免疫學和神經病學等新途徑。發生的變化是解決空間異質性的新工具的出現。SeqFISH和MerFISH是在模型系統中定位基因表達的新穎方法。諸如10x Genomics和NanoString之類的多家公司現在正在使對空間轉錄組學的訪問民主化,引入新技術和測定方法。他們正在開展疾病病理學的研究。
人工智慧與深度學習:增加我們的詞彙量
新的實驗方法通常始於歷史分析方法。讓我們考慮分析的第一步:找到具有相似基因表達的斑點/細胞簇,然後通過縮小尺寸進行可視化。在單細胞RNA-seq中,tSNE投影和顏色編碼聚類可能是標記圖,就像曼哈頓圖對GWAS一樣。
我們尚未利用潛在的組織病理學圖像(疾病診斷和研究的基礎)。我們沒有利用兩個點相鄰的事實。當我們這樣做時會發生什麼?兩個群集之間的邊緣會發生什麼?當細胞類型散布或滲透時,例如在免疫反應中,會發生什麼?有沒有我們沒有考慮的具有潛在影響的圖像分析方法?
諸如卷積神經網絡(CNN)和生成對抗網絡(GANs)之類的概念在分類特徵和基礎隱藏層方面發揮了重要作用。我們可以在空間轉錄組學上超越tSNE,而問題應該在於查看潛在空間(驅動分類區域的數據表示和隱藏生物學的發現)。這些術語和概念是人工智慧的基礎,必須在空間轉錄組學分析中處於前沿和中心位置。
人工智慧和深度學習術語的使用無處不在。擺脫炒作,從自動駕駛汽車到成功的圖像識別(ImageNet Challenge),一些最傑出的成就都充分利用了空間和成像數據。數據很重要,然後有人問:我們是否應該將一個空間轉錄組學部分視為一個實驗數據點,或者是4,000張圖像和4,000個轉錄組?
在空間生物學中,我們可以預期將AI應用於基因或蛋白質活性的逐細胞圖譜將為重大發現鋪平道路,而這些發現可能是我們自己無法實現的。整合空間解析數據可能是我們對生物學的理解的下一個飛躍。我們可能甚至不知道要問的問題,可以通過結合空間轉錄組學和空間蛋白質組學來回答。但是要實現這一目標,我們需要團結一致,並作為一個社區來建立培訓數據集和其他資源,這對於為AI提供最佳的成功機會至關重要。
我們尚未真正充分利用已生成的空間生物學數據。如果我們不解決這一限制,那麼即使我們產生越來越多的此類信息,我們也會繼續錯過。