先祝大家:除夕快樂~
今天想介紹的是我們比較關心的生信學習。生信和R語言並不缺學習資料,缺的往往是明確的方向和學習計劃。
目前網上關於生信的資料非常多,但琳琅滿目的教程並不一定是好事,其中最突出的問題是大部分資料很零散,沒有經過框架性的整理和組織。這些資料很適合入門後的進階學習,好比研究生在擁有科研思維後能快速從海量文獻裡找到自己感興趣的內容。而在入門之前,繁雜且缺乏組織的資料只會讓人無所適從。本次的內容主要匯總當前的一些生信學習資料,由於有我個人學習方向的偏向性,內容肯定不全面。希望能得到大家的支持,提醒我動態補充內容,贈人玫瑰手留餘香,非常感謝!
1、主要的公眾號
由於本公眾號的內容以及我個人的學習都是依靠jimmy老師和他的生信技能樹,這裡先做介紹。生信技能樹目前建立了相對成熟和完整的知識體系,有比較活躍的交流圈,並保持著公益的初衷,對於生信入門和進階者來說都是很好的選擇。
當然,小孩子才做選擇,成年人全都要。其他公眾號的內容也是值得學習的,除了內容和風格的互補,集百家之長也可以激發一些新的idea。單細胞天地也是一個比較大的平臺,產出內容豐富且專業。另外還有解螺旋旗下的新晉生信平臺挑圈聯靠,善於對生信相關知識進行拆解分析。
接下來的公眾號個人了解並不是很多,偶爾看看感興趣的推送,此處排名無先後,隨機的,大家自行選擇。
2、其他論壇、博客等
除了公眾號還有其他平臺和圈子,潛伏著很多無私的內容生產者(當然也存在個別勤懇的搬運工)。不過海量的內容分散在各大論壇和博客,很難收集。這裡介紹幾個主要的網站(考慮到語言和網絡的問題,國外的只提了Github這種必備的),排名也不分先後,不過個人最喜歡簡書,因為我學的東西比較基礎。這些網站也是百度最常指向的網站,大家可以自取所需:
簡書
知乎
B站
新浪微博
CSDN
Github
博客園
3、可視化網站
目前可視化網站越來越多,對於輕度生信依賴的人來說完全夠用。部分網站的功能還在不斷擴展,除了常規的作圖可視化,還可以直接做分析,十分的友好和實用!這類網站越來越多了,只介紹幾個常見的:
Hiplot:https://hiplot.com.cn/
仙桃love:https://www.xiantao.love/
Dr.Tom:https://biosys.bgi.com/#/report/login
歐易雲平臺:https://cloud.oebiotech.cn/task/
ImageGP:http://www.ehbio.com/ImageGP/
NetworkAnalyst:https://www.networkanalyst.ca/
其他優秀的網站歡迎補充~
4、生信教程
由於網絡上的資料過於分散,而紙質的教程看起來又非常晦澀,這裡只介紹生信技能樹發布的,免費並已經形成體系的教程。目前很明確,不希望大家成為漫無目的生信資料收藏家。。。我原來也是個優秀的微信收藏家,後來發現不實質性的投入時間,收得再多也沒用啊。。。
A、Linux/ubuntu系統基礎
生信入門環境的:https://www.bilibili.com/video/BV1cJ411e7UH
生信伺服器的:https://www.bilibili.com/video/BV1XW411d7Bp
生信軟體的:https://www.bilibili.com/video/BV1ps411M7UZ
電腦配置參考視頻
https://www.bilibili.com/video/av80872684
必備軟體安裝,根據自己的作業系統選擇
騰訊微云:
https://share.weiyun.com/564ke1c 密碼:gh8ca7
百度網盤:
https://pan.baidu.com/s/1upnRTXwkI0hvxuuA2Gm49w 提取碼: cnrv
R包安裝,跟著指引來:
http://www.bio-info-trainee.com/3727.html
3個小測序教學視頻:
https://share.weiyun.com/5dLV9A7 密碼:wsstn9
B站視頻,主要是linux和R基礎:
https://space.bilibili.com/338686099
如果只是生物信息學需要,請看第2~9章節,就是到P30即可:
https://www.bilibili.com/video/av40331948/
生物信息學之linux,視頻連結:
https://www.bilibili.com/video/av28813815
LINUX的練習題
最低要求是完成linux 20題
http://www.bio-info-trainee.com/2900.html
其次完成生物信息學數據格式的習題 (blast / blat / fa-fq / sam - bam / vcf /bed /gtf-gff),收集這些格式的說明書。
fasta和fastq格式文件的shell小練習
http://www.bio-info-trainee.com/3575.html
sam和bam格式文件的shell小練習
http://www.bio-info-trainee.com/3578.html
VCF格式文件的shell小練習
http://www.bio-info-trainee.com/3577.html
B、R語言及GEO數據分析
R語言鏡像
options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="http://mirrors.cloud.tencent.com/CRAN/"))
options(download.file.method = 'libcurl')
options(url.method='libcurl')
R全套資料
GEO資料庫挖掘課程,代碼在:
https://github.com/jmzeng1314/geo
如果網絡很差,就下載打包版本的geo代碼:
https://share.weiyun.com/5vrfsqv
並且一定要做作業,比如:
https://mp.weixin.qq.com/s/4VP8fK5rTRW9aiJwYFxzNw
配套教學視頻在B站:
https://www.bilibili.com/video/av26731585/
還有一個公共資料庫挖掘:
https://www.bilibili.com/video/av37568990
視頻應該是都在:
https://www.bilibili.com/video/av25643438/
如果是需要安裝R包,請務必參考:
http://www.bio-info-trainee.com/3727.html
專門為R語言建立了 GitHub 倉庫存放相關學習路線指導資料:
https://github.com/jmzeng1314/R_bilibili
生信基石之R語言,B站10小時教學視頻
參考 GitHub 倉庫存放的相關學習路線指導資料:https://github.com/jmzeng1314/R_bilibili
可以參考一些優秀筆記,比如:
https://mubu.com/doc/2KUiSCfVsg
相關習題
初級10 個題目:
http://www.bio-info-trainee.com/3793.html
中級要求是:
http://www.bio-info-trainee.com/3750.html
高級要求是完成20題:
http://www.bio-info-trainee.com/3415.html
統計專題 30題:
http://www.bio-info-trainee.com/4385.html
可視化專題30題:
http://www.bio-info-trainee.com/4387.html
C、單細胞數據分析
全網第一個單細胞課程(免費基礎課程)
免費學習地址在B站:
https://www.bilibili.com/video/av38741055
務必聽課後完成結業考核20題:
https://mp.weixin.qq.com/s/lpoHhZqi-_ASUaIfpnX96w
課程配套資料文檔在:
https://docs.qq.com/doc/DT2NwV0Fab3JBRUx0
技能樹出品的第二個單細胞課程(進階課程,仍然免費)
詳情請自行閱讀介紹:
https://mp.weixin.qq.com/s/bLfO-8ri_SNUepGs4UwRQw
本課程長期答疑文檔:
https://docs.qq.com/doc/DT0FxbEpHYU5ZVlpu
因為課程涉及到知識點太多,所以我拆分成為了5個子課程,歡迎B站提問彈幕交流!全部連結是:
「生信技能樹」單細胞進階數據處理之文獻導讀,連結是:
https://www.bilibili.com/video/BV17f4y1R7N8
「生信技能樹」使用10X單細胞轉錄組數據探索免疫治療,連結是:
https://www.bilibili.com/video/BV1xD4y1S74P
「生信技能樹」單細胞基因組數據拷貝數變異分析流程,連結是
https://www.bilibili.com/video/BV1Yf4y1R75R
「生信技能樹」雲伺服器處理單細胞轉錄組數據,連結是:
https://www.bilibili.com/video/BV154411Z7DU
「生信技能樹」使用Smart-seq2單細胞轉錄組數據探索小鼠性腺發育,連結是:
https://www.bilibili.com/video/BV1454y1q77Z
基礎課程學完後需要完成作業:
https://mp.weixin.qq.com/s/lpoHhZqi-_ASUaIfpnX96w
就是熟練掌握5個R包,需要熟練掌握它們的對象,而且分析流程也大同小異:
scater,monocle,Seurat,scran,M3Drop
step1: 創建對象
step2: 質量控制
step3: 表達量的標準化和歸一化
step4: 去除幹擾因素(多個樣本整合)
step5: 判斷重要的基因
step6: 多種降維算法
step7: 可視化降維結果
step8: 多種聚類算法
step9: 聚類後找每個細胞亞群的標誌基因
step10: 繼續分類
我都是這樣教導學生完成單細胞學習的
D、學徒作業系統
生信技能數的學徒作業已經非常成熟,讓新手在學習的同時也能獲得更多分享和交流的機會:
https://mp.weixin.qq.com/s/b3rR--dUwAZSvibF07-WQQ
最後再說明下:
本篇收集的資料皆是優秀的大佬們產出的內容。
目前收集的資料還非常不全面,希望大家多多參與和提建議。
本篇的內容將持續更新,內容結構也會根據收集內容的變化不斷調整,希望最後能列出一個入門和進階學習的總提綱,讓大家目的更明確,跟頭翻更少。
多謝大家的支持!還是那句話,贈人玫瑰手留餘香,讓我們把知識共享起來。如果有心寫點東西麻煩私聊我,除了在我們自己的公眾號推送,好的主題還可以考慮提交到生信技能樹參與交流。
另外想對還沒入門但有強烈需求的童鞋們說,學習生信一定要行動起來啊,臨淵羨魚不如退而結網。
祝大家除夕開心~新年快樂~