橘子,生信組技術支持,特徵描述:生信分析實操僅做過數據下載和差異分析
Devil Cui,生信主管,特徵描述:疑難解答總是超出你以為的詳細
橘子前兩天有個case比較急,把方案發給Devil Cui之後,備註如下:這個case申請加急,我只用了基礎分析方法,麻煩在XX天之內出結果。
然後就被Devil Cui科普了一通分析過程/實際工作量/分析耗時/運行中可能遇到的問題/應該給出的解決方案,巴拉巴拉巴拉。。。。。。這個事件的主角之一就是LASSO回歸模型,鑑於近期機器學習比較火,LASSO回歸堪稱發文神器,接下來我們一起來看看這一非基礎分析到底是個啥?
LASSO回歸:全稱Least Absolute Shrinkage and Selection Operator,通過對所有變量進行回歸懲罰,使得相對不重要的變量係數變為0,從而被排除在建模之外,進而選擇出對因變量影響較大的自變量並計算出相應的回歸係數,最終得到一個預測模型。
看圖說話:首先根據左圖曲線最低點確定懲罰值(即曲線最低點對應的上坐標),在右圖的相應懲罰值的位置劃上一條豎線,每一條曲線代表一個變量,與該懲罰值相交的變量即為模型最終所納入的變量,變量所對應的縱坐標即為該變量的回歸係數(在回歸方程中,回歸係數表示自變量對因變量影響大小的參數,也可以理解為該變量的貢獻度)。
分析結果:通過該分析可以得到影響疾病發生的因素(這裡篩選得到的是2個基因),風險值risk score就等於各變量的(表達量*回歸係數)之和。預測模型建完了,接下來就要對模型的準確性進行評估了,(恰在此時,醒木一響)欲知後事如何,請聽下回分解,今天就告一段落,再見。
PS:這篇推文寫好之後,我的小夥伴們先行閱讀了一遍,大家紛紛吐槽過於直白(雖然是事實~~)。鑑於後續將推出一系列看圖說話,接下來請大家自行決定後續是否要寫的嚴肅一點:支持直白的請在文末點讚,支持嚴肅的請在文末點在看(可以名正言順讓Devil Cui親自動筆了,哈哈),不要手滑哦。
註:此推文未經許可禁止轉載!
閱讀推薦: