如何利用大數據做遺傳病智能化診斷?| 雷鋒網公開課

2020-11-23 雷鋒網

據OMIM資料庫(人類孟德爾病資料庫)數據,單基因遺傳病的病種數量約有7000種,其中約4000多種致病基因和發病機制比較明確。單基因遺傳病單個發病率低,但單基因病種類極多,所以總體發病率高,且具有先天性、致死致殘性的特點。

就診斷而言,單基因遺傳病涉及多個學科,臨床症狀複雜,且由於基因的突變具有多樣性,每種突變都可能導致不一樣的臨床症狀,而突變的臨床意義也相當複雜,故診斷較為困難。而且,許多遺傳病都及其罕見,屬於罕見病,對於一名醫生來說,診斷經驗不足,根據症狀極易誤診。

所以對於臨床醫生而言,這些問題顯得頗有挑戰性:根據患者症狀如何快速鑑別其是否為遺傳病?患者表現為某些特定症狀時,哪種基因突變的概率最大?

如今,隨著基因測序成本的大幅下降,隨之而來的是基因大數據的出現,在這種形勢下,基於基因型和表型的關係,建立輔助診斷系統和臨床知識庫看起來是一條容易且有效的路徑。那麼,具體搭建過程是怎樣的呢?會遇到什麼意想不到的挑戰呢?這種方式做遺傳病診斷,遇到最大的瓶頸是什麼呢?

雷鋒網(公眾號:雷鋒網)邀請了發布國內首款遺傳病智能問診系統的北京金準基因公司副總裁孫雋回答這些問題。

嘉賓簡介:

孫雋,北京金準基因科技有限公司副總裁,2008年博士畢業於中科研昆明動物研究所,主攻細胞生物學,畢業後在美國康奈爾大學營養系繼續進行基礎研究,2011年回國後希望能夠從基礎科學走出來向應用方面轉化。2013年加入天津華大進行遺傳病相關基因檢測產品開發工作,2016年加入專注遺傳病基因檢測的北京金準基因負責產品研發。

雷鋒網對其演講內容做了不改變原意的編輯:

我來自北京精準科技有限公司,這三個詞可以概括我們公司做的事情:基因檢測遺傳病基因檢測;專注於遺傳病基因檢測。我本人也一直從事遺傳病基因檢測相關產品的研發工作,今天主要和大家分享的是遺傳病基因檢測的原理和目前的一些進展,以及隨著大數據而來的智能診斷。

(公開課視頻如下,孫老師聲音甜美、循循善誘……強烈建議先看視頻!)

基因、表型、疾病與診斷

事實上,疾病就是人體表現出表型的一種,即每一個人表現出的樣子,這些表型中有些不是疾病,只是體現出人體的多樣性,比如膚色、發色、智商、身高和運動能力等,這些差異不是疾病。但是有一些表型就是疾病,比如說智力障礙、先天性白內障等,這些嚴重地影響到正常生活,就稱之為疾病。我們可以說每個個體表現出的樣子幾乎都和遺傳相關,疾病也不例外。

同時凡事都有兩面性,無論疾病還是其他表型都受環境和遺傳因素兩方面影響,環境因素包括營養因素、理化因素、社會因素和感染外傷等,遺傳因素包括染色體異常、單基因缺陷等。但是疾病與環境和遺傳的相關程度不同,有些疾病受遺傳因素影響的比較多,比如說染色體病、單基因病、孤獨症、一些先天性的缺陷和障礙等。一些疾病受環境影響比較多,比如理化因素的損傷、外傷等,這些疾病完全受環境調控;一些疾病既受環境影響,也有遺傳因素影響,比如身高矮小症,我們知道一個人的身高,即受到環境影響,也受父母遺傳影響。

一、所謂的遺傳因素是什麼呢?遺傳因素的本質什麼呢?

要從人的細胞說起,細胞是生命的基本單位,遺傳物質蘊藏在細胞核和線粒體中。人類的細胞核中有23對染色體,細胞核中可行使功能的基因約2萬多個。染色體展開是DNA雙鏈,基因就是排布在DNA雙鏈上,基因如何行使功能呢?

人體除水分外,蛋白質是最主要組成部分,同時是支撐我們生命活動最關鍵成分。那蛋白質從哪裡來?

蛋白質是由基因編碼而來。基因通過中心法則,先轉錄成RNA,在蛋白質工廠核糖體加工,以其為模板,合成不同的蛋白質。合成的蛋白質到人體的各個部位行駛各種各樣的功能,包括血紅蛋白、皮膚膠原蛋白等,另外非常重要的一組是各種各樣的生物酶。

這時,若有些DNA變化,破壞雙鏈結構,蛋白沒辦法正常行使功能。比如眼睛晶體蛋白的可溶性既不能過高也不能過低,過高將無法支撐眼球的形狀,過低則會使得蛋白沉積,改變眼球的透光性,導致白內障。編碼蛋白必須按照正常的程序來做。如果編碼蛋白程序不正常了,那會影響到正常生命活動,就構成了遺傳病。我們可以說:遺傳病就是遺存物質發生了破壞,正常基因功能改變而引起的疾病。

二、遺傳病分為哪些種類?基因檢測通常是指哪種類型的遺傳病?

我們常見的遺傳病分為這些種類:染色體病;單基因病;多基因病。

我們目前了解比較清楚、遺傳關係和疾病關聯很明確是染色體病和單基因病,我們所說的基因檢測多半在這個領域,多基因病目前還停留在科研階段。

三、單基因病和染色體病

單基因病是單個基因缺陷所導致的疾病,有些人可能會想到罕見病,罕見病指那些發病率極低疾病。(關於罕見病,雷鋒網對此曾有詳細解讀:《基因療法應對罕見病的進階之路》)中國沒有明確的罕見病定義,根據世界衛生組織的定義,罕見病是患病人數佔總人口的0.65‰到1‰的疾病。80%的罕見病是單基因遺傳病,目前單基因遺傳病總共有8000多種,單基因遺傳病並不意味著罕見,雖然單個疾病發病率低,但其數量繁多,累積起來可達到這個全球出生人口數的1%。另外,一些單基因遺傳病,其本身的發病率就很高,比如馬凡症候群、藥物性耳聾等。

不同於單基因遺傳病,染色體疾病比我們想像危害更為嚴重,染色體異常包括染色體數目和結構異常。其中,大家經常聽說的唐氏綜合症、貓叫症候群等,均屬於染色體數目異常。

數據表明:幾乎所有的染色體都有發生非整體疾病的可能,單為什麼平常所見的大多為21三體症候群呢?

那是因為在所有的染色體中,21號染色體的數目最小,故畸變後活胎率較高,其他染色體發生畸變後可能根本就沒有活胎。除此之外,染色體畸變與自然流產也密切相關。

我們知道任何事情都有其原因所在,我們看見的是他表現出的樣子,背後的原因是什麼,進一步的分析才可能進行下一步防控。

四、那我們怎麼樣發現遺傳物質的變異呢?

遺傳病基因診斷流程大致是:樣本收集,DNA提取和處理,然後測序,或者進行一些實驗操作之後,對詞其數據進行分析,後由專家團隊根據數據分析結果進行疾病關聯性分析,最後出報告進行遺傳諮詢。

當前情況是,不管你用什麼樣的技術,診斷無外乎就是這些流程,只不過在數據產出階段,存在不同平臺和不同策略,即做不一樣的調整和組合。

什麼阻礙了我向前?——遺傳病檢測和診斷最大的瓶頸

遺傳病的檢測和診斷,目前它最大的瓶頸和挑戰是什麼呢?

  • 據歐美資料庫統計,目前已知的單基因遺傳病總數有8000多種,那明確基因的疾病有4828種,即41%疾病的機理是不明確的。我們做檢測,首先需要知道:哪個基因出問題了?之後我們才可以把它給測出來。如果對一種遺傳病的致病基因不明確,之後的測序分析過程也無從下手,所以這是它的第一個缺陷。

  • 限制遺傳病檢測和診斷的另一個瓶頸是:即使是已知的基因,也有一些由於其序列特點以及一些其它的困難,用目前的手段沒辦法檢測,因此,明確的42%的基因,也有一些缺乏有效的基因檢測手段。

目前,單基因病的總體檢出率在50%以下。整體看來,可以分為四個部分:8000餘種單基因病中有4000多種致病基因是明確的,理論上這些疾病可以檢測,但其中有一部分由於技術局限性的限制沒辦法檢測,意思是雖然明確具體哪個基因有缺陷,但測不出來。

常見檢測技術有哪些?

所謂檢測/測序,就需要藉助各種檢測技術,目前常見的檢測技術整體來說是兩個思路:

第一,是把DNA一個個測出來,之後明確致病基因是什麼。

第二,是藉助晶片和探針,其上帶有螢光信號,之後通過螢光信號分析以及一些定量分析確定致病基因的有無。

我們測序的技術分為一代測序、二代測序和三代測序。一代測序的優點是準確,但其限制是通量很低;二代測序,又稱高通量測序法,特點是多快好省。在人類基因組剛啟動時,數個大國一起花費了幾十億美金,才完成了一個人的基因組全測序。在現有的測序技術條件下,只需幾天功夫,花費幾千元就能得到一個人的基因組數據。

二代測序技術應用的常規檢測流程包括:樣本收集、數據產出到信息分析。我們知道,二代測序結果都是一些短序列,需要把成千上萬短序列列起來,與參考基因組比對,之後進入信息分析流程,檢測變異,進行注釋,得到一個待解讀變異列表,之後分析團隊對這些突變進行分類,並進行一個疾病相關性分析,以確定該疾病的突變,最後還有進行驗證和報告。無論二代測序技術應用於疾病基因檢測或其它,一般流程都是這個。

但儘管二代測序多塊好省,但它也有不足,就是:數據量特別多,是最大的難點。

如何從海量數據中找出真正與疾病相關突變呢?

一、找致病突變兩步走

做一個全外顯子組測序,可以產生10萬個以上的突變,怎樣在10萬個突變中找出致病突變呢?分為兩步:

第一步,對變異進行分類,分類過程中有遊戲規則。目前業內人都是遵照ACMG解讀分類規則這個標準,這個標準是,美國遺傳學會對突變分類設定了嚴格的條件,其中包括致病性的證據、突變是否屬於劣性、是否已經發生過、突變發生的位置等。第一步相對在整個遺傳分析的過程中較為簡單,真正的難點是表型相關性的分析。

第二步,做完分類以後,已知的和臨床意義不明的基因都可能和疾病相關,接下來就需要從這些突變中找出和病人表型相關的部分,在這些突變中尋找這個基因和什麼疾病相關。

在以前報導的資料庫中尋找,已經報導的病人都是什麼表型,與我的病人的表型是否相符。最終確定一個突變是不是某種疾病的原因。用二代測序技術測基因序列之後,我們發現了大量的突變,但僅靠人工去收集那些判斷突變的證據,幾乎是一個不可能完成的任務,因此,需要用到信息分析流程進行處理。

二、信息分析在做什麼?

信息分析主要會產生這幾方面的信息:

  • 首先是引發突變的基本信息,即突變發生在哪個DNA上?哪個位置?

  • 另外是疾病信息,這對於後續要進行的表型關聯性分析非常重要。

  • 還有在人群中的頻率,我們知道單基因遺傳病相對罕見,因此它在正常人群中的出現頻率不能過高。

  • 軟體預測的結果。目前有許多軟體可以預測突變有沒有可能破壞到蛋白結構?

  • 最後是資料庫收錄的情況。主要收錄的是病人,即以往的各種研究機構、檢測機構、發表的文獻等中報導過的突變和疾病的關聯情況。如果該突變已經在一個病人中被檢出過,並且明確為致病原因,那麼我們檢測自己的病人時,可以相對明確的去確定它是否和病人的表型相關。

總體來說,信息分析的方式就是將解讀一個突變所需要的基本信息整合起來。那信息分析後的結果呢?

三、表型相關性判斷是智能化診斷的難點

做完信息分析後,會發現大堆的已知疑似和臨床意義不明的突變。

在這種情況下,需要人工分析每個突變,確定其是否與病人的表型相關,如果相關,會進行報告,後續的會進行各種各樣的驗證以該突變和疾病的關係。如果只測了一個基因,那產生的突變數量有限,人工可以完成表型相關性分析。但如今的測序技術飛速發展,能多快好省地測越來越多的基因,相應地就有更多需要人工分析其表型相關性分析的需求。在全外顯子組測序中,大約會有200到300個突變分析人員做表型相關性分析。其實這種做法的效率很低。那既然有分類規則、有規律可循,可不可以讓計算架來幫我們做這些事情呢?

做智能化診斷有多難?

與智能化相伴隨的另一個詞是大數據。

事實上,人工智慧這個概念70年代就已經被提出了,所謂神經網絡算法以及一些公式在那個時候就已經有了,但近些年來,它忽然大熱,就是因為大數據的出現。沒有大數據支撐的智能化運算,就像汽車沒有輪子一樣。反過來也是一樣的,如果有大數據,還需要相應計算能力幫助實現智能診斷。

剛才我們說過了,如果要做病人基因數據、測序數據的分析,人工的做法是:第一步,把突變進行分類,將那些良性或疑似良性的扔掉;第二步,用剩餘的突變去關聯該疾病的表型,並與重點對象的表型進行比對。

一、突變評級

突變評級有遊戲規則,故突變評級相對簡單,相對來說也是可自動化操作的。評級無外乎就是參考一些資料庫。

1、正常人群資料庫

首先是正常人群的資料庫,這個是一個非常重要的參考依據,如果要看頻率,一定是數據量越大越好,所以,我們常用的正常人群資料庫的趨勢是越來越大。正常人群資料庫的作用主要有2點:

2、軟體預測

另外,軟體預測的結果也可作突變評級的參考。

其中有保守性預測的軟體,所謂保守性預測,是指如果一種蛋白比較重要,那在不同物種中都有該蛋白的同源物。如果其存在不同物種中,甚至在人類的進化中,它都一直在,一隻保持不變,那麼可能意味著,這個蛋白非常重要。如果它發生突變,相應的個體就會被淘汰掉,這是保守性預測的一個依據。保守性預測是藉助於其他物種的全基因組合蛋白數據,而這是非常大的數據量,所以遺傳分析離不開數據。

另外還有綜合性預測軟體,除保守性預測之外,還要參考人群頻率,參考胺基酸的生化性質等等數據,這種方法需要多個的數據以證明方法是可靠的,並且是一個不斷修正的過程。

3、疾病人群資料庫

在突變分分歧時,需要考慮:這個突變是否在過往的有類似表型的人身上出現過。如果有,並且確定它是致病的,那對突變評級是一個非常有力的支持因素。因此,分析也需要非常龐大量的疾病人群資料庫。一般疾病人群資料庫無外乎包含這些信息:病人的信息:男女、年齡,表型信息;基因型以及數據的來源等。

這些資料庫和軟體預測,這些證據可以用於突變評級,是我們分析的第一步。綜合多種遊戲規則寫出一個公式,就可以相對方便的,對所得的突變進行分級。

二、真正的難點——症狀關聯分析

但上述工作做完之後,才遇到智能診斷真正的一個難點——也就是症狀關聯分析。

傳統關聯分析的做法是挑出所有需要解讀的突變的基因,然後到資料庫裡看,找到基因關聯的是什麼疾病,表型是什麼。之後,基於之前的受檢人信息,人工進行比對。那對於智能化診斷的智能化症狀關聯,思路是怎樣的呢?

具體過程是這樣的:對病人進行臨床症狀的分析,之後進行臨床症狀的標準化,然後根據標準化的這個詞,搜索基因疾病表型資料庫,然後得到疾病和基因列表,根據其與和病人表型的相關度進行排序。其中,關聯的關鍵是需要把表達同一個意思、關聯同一種異常的不同詞關聯起來,通過前期的數據積累關聯起來,然後才可以把疾病和病人進行關聯

1、做這個的難點是什麼呢?

在整個過程中,無論用什麼算法,無外乎是一種匹配和關聯的。但實踐落地的時候會碰到真正的難點。

  • 首先是臨床信息不規範。一種表型有多種表述方法。比如智力障礙,那可以說腦子有問題、遲鈍、傻、呆、笨等,表述方法是多種多樣的。這種不規範的表述導致沒有辦法用標準化的語言,意思就是雞同鴨講,輸入的表型信息算法沒辦法識別,

  • 第二是病人的臨床信息不完整。人工分析的時候,也常常遇到這樣的情況:送檢單上根本沒有完整地呈現出病人的完整信息。比如有一些病人只有一些發現時的信息,但像某些細菌性疾病、代謝性疾病,早期與後期的症狀是非常不同的。所以,這些情況下, 在標準化資料庫中進行搜索,關聯的常常是不準確的。

  • 第三,單遺傳病常常具有臨床抑制性,相同的基因所關聯的疾病很多,且即使同一個突變位點,不同的病人表型也是不一樣的,那麼這樣也給智能化檢索帶來了很大的難度。

  • 第四,表型不完全外顯,即基因突變所導致的表型沒完整展現出來,這種情況下,表型本事不能代表典型的性狀。

我們在做智能化檢索時,在疾病表型資料庫方面,目前還存在很大提升空間。其中存在這樣的問題:

如何應對這些問題?

對於這些問題,金準基因怎麼做的呢?

首先,相對來講,臨床信息不規範的問題目前解決得比較好。我這裡給大家介紹的是HPO——臨床症狀定義、分級。HPO,創建描述人類疾病中異常表型的標準詞條,每一個詞條都能精確描述一種人類異常表型,並且組成一個樹狀結構。也就是說,目前所能想到的所有疾病體現出的所有表型,全都標準化了。

它的特點是沒有含義是唯一的,很精細,關係明確,計算機可識別。

目前,HPO資料庫總共包含了11000種表型,並且其與疾病關聯到了一起。也就是說,這4000種疾病分別都有哪些表型,這個資料庫已經進行了基本的關聯。中國對HPO資料庫進行了一個標準用語的翻譯,即所謂CHPO。截至2016年10月,已翻譯詞條11896種。

下面這張圖清晰地呈現了其構架:呈樹狀結構;根部是眼部異常,往下走是眼部形態異常,之後眼球異常,眼前節異常、晶狀體異常到白內障,最後關聯到一個最底下一個單獨的ID是先天性白內障。

有了HPO以及注釋出來的資料庫以後,就可以就是做一些智能化表型關聯的嘗試。北京精準科技有限公司推出了國內首款單基因遺傳病輔助軟體——明鑑系統,我們的做法,也如前面所介紹的。

三個案例

案例一:「我們還沒有達到100%精確的地步」

這是一個11歲的男孩,其臨床表徵是是肝硬化、門靜脈高壓、肝功能亢進、全血細胞減少。看到這種情況,醫生想重點關注的基因是:血色病相關4個基因(HAMP、HFE、HFE2、SLC11A3 )、多囊腎(PKD1、PKD2)、先天性肝氫氧化。但在這幾個基因上均未發現可疑的突變位點。

但我們通過基因檢測,在PKD1這個基因上呢,發現了一個已知的致病突變,所謂已知是指已經在病人中被檢出過了,意思是其致病性應該是非常明確的。

那這個案例在明鑑系統上如何操作呢?

首先呢,TERT基因對應21個OMIM編號的疾病,共101種臨床表型。這個病人兩個主要的臨床表型是肝硬化和全血細胞減少,肝硬化對應的是72個基因,全血細胞減少對應74個基因,因此兩者對應基因交集,理論上便是參考範圍。這是我們計算的一個原則,我們做了這個交集以後,得到了10個基因。TERT也在這10個基因中,並且排名非常靠前。這個案例中,明鑑系統找出一個列表,但這個列表並不是唯一的,所以我們還沒有達到100%精確的地步。

案例二:在不明確症狀時,選擇更廣義的症狀

第二個案例是一個11歲的女孩,雙下肢進行性運動障礙四年,肌肉活檢、電圖沒有異常,沒有吞咽困難,構音不清等其他症狀,僅表現為運動障礙,另外,否認家族史。頭MRI檢測結果為:腦白質病變。我們對這兩個症狀進行檢索:即輸入運動障礙和腦白質病變,明鑑系統做了計算,輸出右邊框中的這些基因。

結合這個新列表與基因測序的數據,我們發現:排名倒數第二的EIF2B5基因,在白質消融性腦病上出現過,顯出一個融合突變。就這個突變,我們也可以關聯出一系列有這樣表型的列表,進一步提高其準確性。

我們輸入運動障礙,這個詞所在的根目錄是神經系統異常,之後是運動神經異常、神經異常、運動異常、運動障礙。但運動障礙的下遊還有各種各樣的條目,再進一步,我們把他關聯到步態不穩。同時輸入步態不穩和白質腦變,發現所關聯的基因是EIF2B5。在我們所有的計算結果中,這兩種表型的關聯結果準確性排名第一。

這個案例告訴我們,在做智能化表型關聯時,我們輸入的表型直接影響到結果,在不明確症狀時,我們可以選擇更為廣義的症狀,從而擴大計算出最終結果的量。

案例三:智能進化,測評失敗案例進行學習

第三個案例是一個17歲的男孩,其臨床表型是全身皮膚發黑、生殖器未發育,智力低下,口齒不清;主要病史:性激素低下、皮質醇低下、垂體促性腺激素低下、腦垂體核磁正常、腎上腺CT未找到腎上腺;家族史是母親有智力低下病史、父親殘疾(走路不穩)。

我們在明鑑系統中輸入這個病人的幾個表型。

第一個表型是腎上腺皮質腎上腺缺失、腎上腺異常;第二個表型是生殖器異常;第三個表型是皮膚色素異常。在這3個表型的引導下,我們生成一個基因突變列表。關聯這些基因與基因測序數據,我們沒有發現可疑突變。但我們進一步分析發現,這個基因有其他類型的突變。我們進一步對這個案例進行分析,在生成的結果中排名第一的NR0B1基因有一個原因未知的情況。

我們到資料庫中看這個基因,其所關聯的表型腎上腺發育不全、促性腺激素分泌不足、性腺功能減退症,但是46種表型中並無智力低下,並沒有病人智力低下這一表型,因此其是不相符的。但我們進一步分析發現,另外一個基因IL1RAPL1,表型為X連鎖智力低下21型、女性雜合攜帶者會出現輕度智力低下。

這個案例是這兩個基因共同導致的表型,不是一個嚴格意義上的單基因病,而且是兩種單基因病共同組成的一個複雜表型。我們對這兩個基因進行分析,發現他們在染色體上的位置非常接近,均有缺失/插入的疾病報導,臨床症狀符合,之後我們就去做了臨近缺失及重複致病可能性計算。

我們不斷積累這樣的案例,不斷測評並且反饋給系統,這個系統得以不斷改進。我們的願景是,我們需要進一步提升該系統的表型關聯、準確性以及各方面的技能,我們能做的就是數據積累,才可以不斷測評,不斷改進。

總結一下,明鑑系統的特點有:

1、輔助臨床症狀輸入:根據HPO樹狀結構,標準化語義輸入是遺傳病診斷的根本。

2、相關基因突變類型提示,即基因突變多樣性。

3、智能進化,測評失敗案例進行學習,研發改進方案。

4、方便後續數據管理——下載及快速關聯。

最後總結一下,表型相關性判斷是智能診斷的難點,是做遺傳分析兩大步中非常重要的一部。難點在於,病人臨床信息不規範、臨床信息不完整是兩個相對來說比較容易解決的,我們可以使用HPO這樣的資料庫,對其不斷推廣、不斷改進。如果疾病的每一個患者都用相同的語言來描述臨床表型,那就可以很方便地進行關聯。病人信息、其臨床信息突發性和表型不完全外顯等情況是目前需要進一步改進的。我們需要完善疾病表型資料庫,該資料庫需要包括疾病的不同階段。疾病不同階段的人員越多,就可以關聯得越完整。另外,人越多越好。

疾病表型資料庫本身的構建存在的困難也待於慢慢改進的。首先是疾病樹木很多,構建疾病表型資料庫難難度非常大。另外,多機構的數據整合困難。

願景:實現基因組和疾病組的對話

如果說HPO是一個關聯,表型的標準化可以實現基因組和疾病組的對話。這裡有三個不同的維度:

一、基因組,我們需要覆蓋得更全面,需要測試的準確度更高;需要各種各樣的算法進行建模;需要很強的數據存儲能力;儘量多的人群。

二、表型組:進一步標準化、詞條化、統一化。更多進行關聯,目前雖然已經有大量的表型,但並沒有100%覆蓋人類所有的異常表型。

三、疾病組:關鍵是全和準。疾病組的全和準是遺傳病智能診斷的關鍵。

整個基因檢測流程是一個非常長的環節,涉及多個領域,需要IT人員、醫生、病人、生物學家等多種力量的參與。對於遺傳病來說,其智能化診斷才剛剛開始,徹底推向臨床還有待時日。

相關文章:

繼DeepMind發力眼疾後,IBM的認知計算能診斷95%的早期青光眼

不放過任何蛛絲馬跡,IBM Watson 將利用醫學影像診斷心臟病

如何利用大數據做遺傳病智能診斷?| 硬創公開課預告

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 關於醫療大腦、知識圖譜與智能診斷,這是最全的解讀 | 雷鋒網公開課
    雷鋒網按:本文整理自康夫子創始人張超在雷鋒網硬創公開課上的演講,主題為「智能診斷與醫療大腦」。張超:康夫子創始人,前百度自然語言處理部資深研發工程師、文本知識挖掘方向負責人;知識圖譜、實體建模方面專家;畢業於電子科技大學計算數學專業、新加坡國大多媒體搜索實驗室研究助理。以下為公開課內容:雷鋒網:簡單介紹一下康夫子所做的事。
  • 詳解:智能醫學影像分析的前沿與挑戰 | 雷鋒網公開課
    雷鋒網按:本文整理自雅森科技高級算法研究員楊士霆,在雷鋒網(公眾號:雷鋒網)硬創公開課上的演講,主題為「智能醫學影像分析的前沿與挑戰」。四是將想量測的位置進行量化,比如術前術後,讓醫師評估手術前後的差異時,要針對圖像做量化,透過前後數據的差別,協助醫師判斷手術是否成功。上面提到的四個主要問題,都可以通過深度學習的方式來促進診斷,即將需要治療的地方做明確的辨識,輔助醫師做更有效地診斷,找到病灶。深度學習在醫學影像上的應用
  • 如何自行搭建一個威脅感知大腦 SIEM?| 雷鋒網公開課
    在網絡安全的原始森林裡,SIEM就扮演這樣一個威脅感知大腦的角色。如何在合理成本下打造一個最為強大、合適的 SIEM 系統,是許多安全人員頭疼的問題。雷鋒網有幸邀請到了擁有十年安全產品經驗的百度安全專家兜哥,為大家講解如何使用開源軟體搭建企業的SIEM系統。
  • 機器人程序設計之如何正確入門ROS | 雷鋒網公開課
    然而隨著ROS近年來火熱,在教學中也發現很多新夥伴對ROS的認識存在一些誤區,為了加快小夥伴們的學習速度,雷鋒網(公眾號:雷鋒網)本期公開課雷鋒網邀請Top和大家分享一點自己學習和使用的經驗和心得。雷鋒網本期公開課面向想入手ROS卻又不知從何下手的小夥伴,為大家梳理好學習思路。
  • 如何用雲計算模式,實現生物信息分析 | 雷鋒網公開課
    本文整理自華點雲技術總監於偉文在雷鋒網(公眾號:雷鋒網)硬創公開課上的演講,主題為如何用雲計算模式實現生物信息分析。於偉文,高級工程師,上海華點雲生物科技有限公司技術總監。是北京航空航天大學國家示範學科——「移動雲計算」專業的首批畢業生。擁有十餘年 IT 領域從業經驗,主要關注於臨床、生物、金融等領域。
  • AI 從業者該如何選擇深度學習開源框架丨雷鋒網公開課
    (公眾號:雷鋒網)硬創公開課的分享,並由彭河森博士親自整理成文。現在進入正題,我們該如何選擇深度學習開源平臺,參考標準應該是什麼樣的?一、深度學習開源平臺的 5 大參考標準今天主要探討的平臺(或者軟體)包括:Caffe, Torch, MXNet, CNTK, Theano, TensorFlow, Keras。如何選擇一個深度學習平臺?我總結出了下面的這些考量標準。因人而異,因項目而異。
  • 地圖中的語義理解 | 雷鋒網公開課
    編者按:本文整理自搜狗公司王硯峰在雷鋒網硬創公開課上的演講。王硯峰是搜狗公司桌面事業部高級總監,桌面研究部和語音交互技術中心負責人。承擔輸入法、號碼通、個性化新聞等搜狗桌面產品在大數據和算法研究方面的工作,通過研究能力提升產品核心品質推動產品創新。
  • 對於普及無人駕駛,我們有了這四點認識 | 雷鋒網公開課
    即使作為一個成熟的智能系統,如何降低價格或者在廉價傳感器上尋找解決方案?本文整理自「硬創公開課 Online | 無人駕駛」專場。分享嘉賓是馭勢科技聯合創始人姜巖,他是北京航空航天大學博士、美國伊利諾大學香檳分校聯培博士研究生,研究領域為自動駕駛系統架構設計和規劃控制。
  • 語音識別的痛點在哪,從交互到精準識別如何做? | 雷鋒網公開課
    人機互動的未來趨勢如何?本期硬創公開課邀請了科大訊飛的研發主管趙豔軍為大家答疑解惑。雷鋒對於識別來說,首先要保障的是遠場環境下的識別率,除了前面提到的麥克風陣列解決了前端聲學的問題,還要有專門針對遠場環境下,基於大量數據訓練的聲學模型,這樣才能保證識別率滿足交互需求。除了雲端的語音識別,端上的識別也是需要做的,需要雲+端方式進行結合,這樣才能滿足複雜網絡下的使用場景。不過端上主要是去做一些命令式交互,響應一些本地操作。比如關機、打電話、動作指令等。
  • 下一代測序技術,掀開遺傳病診斷的新篇章
    在疾病的臨床診斷方面,隨著 NGS 技術的不斷完善和生物信息學技術的高速發展,近幾年來 NGS 正逐步被用於臨床診斷的實踐領域,利用測序信息結合臨床表型可對遺傳性疾病做出正確的分子診斷。只要有生命傳承,就有發生遺傳病的可能,毋庸置疑,在遺傳病的診斷中,NGS 技術已逐漸成為一項不可或缺的檢測手段,也必將在未來發揮出更加關鍵的作用。
  • 案例丨周軼璐教授:服務好醫生,如何更全面地了解數據、利用數據?
    美國有些機構在很早之前就已經著手研究此類課題,我當時在想如何才能將其準確翻譯成中文,一開始是醫療信息化與智能化,後來我管它叫醫學,因為我認為它應該是個比醫療更廣泛的概念。那麼在醫學領域,我們怎麼看待信息化、智能化呢?可以從大數據中去體現他們的價值。如今我們有很多數據,拿病患信息來說,現在很多醫院都還是紙質信息,原因在於患者在不同時期於各個醫院的就診信息並沒有共享。
  • 深度解析音頻檢測背後的技術 | 雷鋒網公開課
    這一技術是如何進行鑑黃的呢?本期雷鋒網(公眾號:雷鋒網)硬創公開課,我們邀請了極限元智能科技聯合創始人馬驥為大家解讀關於音頻審核背後的技術。以下內容整理自本期公開課,雷鋒網做了不改變原意的編輯:一、音視頻審核的需求現狀音視頻審核主要針對網際網路傳播的信息進行審核,審核的內容有有害信息(涉黃、涉暴)、敏感信息。以直播平臺為例,2016年,是網際網路直播平臺爆發的一年,除了各式各樣的直播形式。
  • 杉數科技CTO王子卓:4大案例告訴你,如何用機器學習玩轉企業大數據...
    AI掘金志硬創公開課《十大場景案例詳解:人工智慧如何提升商業效益》中,我們通過案例詳細介紹了AI用於商業實戰中的場景和效益。因此,本期公開課,雷鋒網邀請到杉數科技CTO王子卓博士來進行主題為「如何利用機器學習做運籌優化與智能決策」的分享。以運籌優化與智能決策為例,王子卓表示,大數據要產生實質價值,必須真正提升決策質量。規律性分析能夠從海量數據中發掘出規律,但是找到規律並不自然而然帶來決策方案,所以運籌優化學和機器學習,就是將實際中決策問題轉化為數學模型,並用高效的優化算法求解。
  • 「定製」健康寶寶 基因診斷讓28種遺傳病無處藏身
    現在,植入前基因診斷技術的出現,將能解決部分人群的煩惱。  金帆介紹,胚胎植入前遺傳診斷技術(preimplantation genetic diagnosis)又稱為第三代試管嬰兒技術,這項技術的核心是在完成試管嬰兒的過程中,利用染色體或基因篩選技術,在胚胎未放入子宮前進行遺傳學分析,判斷其是否正常,能否成長為一個健康的新生命。
  • 農業植保的精準導航——基於RTK技術的地理信息採集 | 雷鋒網公開課
    高精度的地理信息,是精準農業的基礎。本期雷鋒網硬創公開課邀請到極飛地理負責人遊春成,為我們詳細講解什麼是RTK技術,為什麼要在農業植保中使用 RTK 技術以及RTK 技術如何在農田勘測、無人機飛行中運用。以下為嘉賓分享內容實錄。相對視頻文中做了刪減,完整內容可觀看視頻。關
  • 2018 公開課盤點企業篇:十家企業帶你看 AI 的實際應用成果及人才...
    而隨著企業經歷了信息化的成熟階段,沉澱了大量的數據。大型的企業都開始了數位化轉型,利用前沿的技術利用海量的外部數據以及內部積累的業務數據上下遊的連結客戶,將數據轉化為專家的經驗知識,提高工作效率,增強產品的用戶體驗和銷售。而在企業的數位化轉型中,知識圖譜就扮演了重要的作用。基於這個熱點,AI 研習社邀請到了北京知識圖譜科技有限公司 CEO 吳剛進行公開課分享。
  • 第四節 遺傳病與腫瘤的基因診斷
    第四節 遺傳病與腫瘤的基因診斷   從DNA水平上尋找確診遺傳病的指標或探討遺傳病和腫瘤的病因等方面,已取得很大成績,這對產前診斷,早期確診和突變基因攜帶者的檢出等都有重要意義。所用的方法大體有以下幾種。
  • 深度學習新星:GAN的基本原理、應用和走向 | 雷鋒網公開課
    (公眾號:雷鋒網)【硬創公開課】的分享。如果讀者想獲得關於本次公開課的PPT,可前往雷鋒網旗下微信公眾號【AI科技評論】,關注後回復「馮佳時PPT」獲得下載地址。近年來,基於數據而習得「特徵」的深度學習技術受到狂熱追捧,而其中GAN模型訓練方法更加具有激進意味:它生成數據本身。
  • 高危基因和遺傳病的診斷可以促進用藥的改善
    一種特殊的結構和功能的體外檢測方法,既能診斷疾病,又能預測未來身體狀況,這就是我們說的基因晶片,基因晶片可以通過結構和功能和檢測結果綜合判斷人的身體狀況,對此已經使用在很多重大疾病診斷中。不同的基因晶片有不同的應用領域,例如早產兒診斷,法醫鑑定,腦組織檢測,以及臨床上最常見的腫瘤檢測。
  • 我市可孕前診斷單基因遺傳病 孩子告別地中海貧血等遺傳病
    原標題:我市可孕前診斷單基因遺傳病 孩子告別地中海貧血等遺傳病本報訊 (記者 石亨)昨天,重慶晨報記者從第十八屆重慶輔助生殖醫學會議上獲悉,就在今年,重慶已經成為西南地區首個在胚胎植入母親子宮前就能進行單基因遺傳病篩查的城市。