生物信息學/計算生物學這門學科所包含的內容實在過於龐大和繁雜,你幾乎不可能同時掌握所有細分領域。
- 生物學涉及的材料是複雜的,細胞、組織和器官,乃至個體;病毒、微生物、植物和動物;試劑/實驗材料的不同生產批次和生產廠家......
- 生物學涉及的過程和反應是複雜的,DNA/RNA 複製、轉錄、轉錄後調控、逆轉錄、翻譯、翻譯後調控、代謝調控、激素調控、免疫調節、DNA/RNA/蛋白質/小分子化合物等物質間的相互作用......
- 生物學處理和效應是複雜的,基因過表達和沉默、基因編輯和敲除、藥物和安慰劑、正常與畸形、存活與死亡、治癒與耐藥......
- 生物數據的獲取方式和數據類型是複雜的,從簡單的生化儀器檢測的數值到定量和定性的組學測序結果,以及靜態和動態的圖像和影像等等。
- 生物數據分析過程是複雜的,常常是一種檢測儀器就對應了一套數據分析方法。質量控制和評估,異常值檢測,數據標準化,統計變換、統計建模和統計檢驗幾乎樣樣都少不了。
讀書和閱讀不論從什麼時候開始都不算晚,它可以讓我們將知識變得更加結構化和系統化。筆者時常會感覺自己所掌握知識的淺薄,所以常常只能在搜書/文獻、看書/文獻、做項目/寫文章中尋找一些慰藉。
書籍分類
- 生物學/醫學理論
- 計算機基礎和程式語言
- 數學基礎
- 統計學習與算法
- 分布式計算
- ......
論文分類
- 高通量測序技術基礎
- 大型研究項目
- 精準醫學
- 腫瘤生物學
- 生物信息學資料庫和分析工具
- 機器學習的生物信息學應用
- 全基因組數據分析
- 單細胞數據分析
- 非編碼區及同義突變分析
- 泛基因組
- 三維基因組
- ......
書籍推薦列表
一. 生物學/醫學理論
- 《Lewin 基因X(中文版)》([美]J.E.克雷布斯,[美]E.S.戈爾茨坦,[美]S.T.基爾派屈克)
- 《正版 癌生物學 原書第2版 腫瘤生物學生命科學專著系列 腫瘤遺傳學腫瘤研究治療 詹啟敏癌症分子生物學》
- 《基因組學(第4版)》(楊金水)
- 《生物化學:基礎理論與臨床(原書第6版)(套裝上下冊)》
- 《分子生物學(原書第五版)》([美]Robert F. Weaver)
- 《藥物早期臨床試驗/藥物臨床試驗質量管理規範叢書(GCP)》(王興河)
- 《物種起源 達爾文進化論生物信息學圖解科學了解生命是什麼自然史動植物生物學世界科普名著傳世經典書籍》
- 《認知神經科學:關於心智的生物學》([美]葛詹尼加,等)
- 《植物生物學》([英]Alison M. Smith,等)
- 《細胞生物學 翟中和 第四版 教材+輔導習題集 全2冊 細胞生物學考研學習指南習題精解》
- 《發育生物學(第二版)》
- 《生命科學史》([美]洛伊斯·N.瑪格納)
- 《生命是什麼》([奧]薛丁格)
- 《細胞生命的禮讚:一個生物學觀察者的手記 英文原版The Lives of a Cell》
- 《自私的基因 40周年增訂版 平裝(見識叢書25)》([英]理察·道金斯(Richard Dawkins))
- 《自然科學的哲學(當代世界學術名 ) (美)亨普爾,張華夏 中國人民大學出版社》
- 《生物信息學(第三版)》(陳銘)
- 《表觀遺傳學》([美]C.D.Allis,[德]T.Jenuwein,[美]D.Reinberg,[美]M.Caparros)
- 《遺傳學戴灼華9787040220834》
二. 計算及基礎和程式語言
計算機基礎
- 《計算機科學叢書:計算機組成原理》([英]艾倫·克萊門茨(Alan,Clements))
- 《計算機科學叢書:編譯原理(第2版)》([美]Alfred V.Aho,[美]Monica S.Lam,[美]Ravi Sethi,等)
- 《現代作業系統(原書第4版)》(Andrew S. Tanenbaum,Herbert Bos)
- 《計算機網絡:自頂向下方法(原書第7版)》([美]James,F.Kurose,Keith,W.Ross)
Shell
- 《Linux命令行與shell腳本編程大全(第3版) 》([美]布魯姆(Richard Blum),布雷斯納漢(Christine Bresnahan))
- 《鳥哥的Linux私房菜 基礎學習篇 第四版》(鳥哥)
C/C++
- 《C++ Primer Plus(第6版 中文版) 》([美]Stephen Prata)
- 《C Primer Plus 第6版 中文版 》([美]史蒂芬·普拉達(Stephen,Prata))
Golang
- 《 Go語言核心編程 Go語言編程入門教程書籍 golang教程實戰自學基礎入門精通實踐開發 go語言》
- 《Go語言實戰》([美]威廉·甘迺迪(William,Kennedy)布賴恩·克特森(Brian,Ketelsen)埃裡克·聖馬丁(Erik,St.Martin))
- 《Go語言高級編程》(柴樹杉,曹春暉)
- 《Kubernetes權威指南:從Docker到Kubernetes實踐全接觸(第4版)》(龔正,吳治輝,崔秀龍,閆健勇)
- 《Docker技術入門與實戰(第3版)》(楊保華,戴王劍,曹亞侖)
Java
- 《Java編程思想(第4版) 》([美]Bruce Eckel)
- 《華章專業開發者叢書·Java並發編程實戰 》([美]Brian Goetz,等)
R 語言
- 《R語言核心技術手冊(第2版)》([美]Joseph Adler(約瑟夫·阿德勒))
- 《文本挖掘:基於R語言的整潔工具》([美],茱莉亞·斯拉格(Julia,Silge),戴維·羅賓遜,[David,Robinson])
- 《R語言實戰 第2版 》([美]卡巴科弗(Robert I. Kabacoff))
Python
- 《Python學習手冊(套裝上下冊)(原書第5版)》([美],馬克·盧茨(Mark,Lutz))
- 《利用Python進行數據分析(原書第2版) 》([美]韋斯·麥金尼(Wes,McKinney))
- 《Python 3網絡爬蟲開發實戰》(崔慶才)
- 《Python自然語言處理實戰:核心技術與算法》(塗銘,劉祥,劉樹春)
- 《Bioinformatics with Python Cookbook》(Antao Tiago)
JavaScript/TypeScript
- 《JavaScript權威指南(第6版)》([美]David Flanagan)
- 《JavaScript高級程序設計(第3版) 》([美]Nicholas C.Zakas)
- 《TypeScript實戰指南》(胡桓銘)
- 《Web前端技術叢書:Vue.js快速入門》(申思維)
- 《React學習手冊》(Alex,Banks,Eve,Porcello)
三. 數學基礎
- 《普林斯頓微積分讀本(修訂版) 》([美]阿德裡安·班納)
- 《線性代數(第5版)》([美]Gilbert Strang(吉爾伯特·斯特朗))
- 《計算機科學叢書:離散數學及其應用(原書第7版)》([美]Kenneth H.Rosen)
- 《最優化理論與算法(第2版)/清華大學研究生公共課教材·數學系列》(陳寶林)
四. 統計與算法/數據結構/機器學習/深度學習
- 《統計學習方法(第2版)》(李航)
- 《算法:C語言實現(第1-4部分)基礎知識、數據結構、排序及搜索(原書第3版)》
- 《算法(第4版)》([美] Robert Sedgewick,[美]
Kevin Wayne) - 《計算機科學叢書·數據結構、算法與應用:C++語言描述(原書第2版)》([美]薩特吉·薩尼(Sartaj Sahni))
- 《數據結構與算法分析:Java語言描述(原書第3版)》([美]馬克·艾倫·維斯)
- 《數據結構Python語言描述》([美]Kenneth,A.,Lambert,蘭伯特)
- 《圖解數據結構--使用Python》(吳燦銘)
- 《機器學習》(周志華)
- 《機器學習基礎》(梅爾亞·莫裡(Mehryar,Mohri),阿夫欣·羅斯塔米扎達爾,等)
- 《深度學習 》([美]Ian,Goodfellow,[加]Yoshua,Bengio,[加]Aaron,Courville)
- 《TensorFlow:實戰Google深度學習框架(第2版)》
(鄭澤宇,梁博文,顧思宇)
五. 分布式計算
- 《ZooKeeper:分布式過程協同技術詳解》([美]Flavio Junqueira,Benjamin Reed)
- 《分布式緩存 原理、架構及Go語言實現》(胡世傑)
- 《高性能分布式計算系統開發與實現:基於Hadoop、Scalding和Spark》([印度] 斯裡尼瓦沙(Srinivasa, K.G.), 阿尼爾·庫馬爾·穆帕拉(Anil Kuma)
- 《分布式系統概念與設計》(George Coulouris,金蓓弘)
論文推薦列表
一. 高通量測序技術基礎
- Hadfield, J. & Retief, J. A profusion of confusion in NGS methods naming. Nat Methods 15, 7-8 (2018): http://enseqlopedia.com/enseqlopedia/,測序技術的百科全書
- Schuster S C. Next-generation sequencing transforms today&34;Comprehensive evaluation of structural variation detection algorithms for whole genome sequencing."Genome biology20.1 (2019): 117. 系統地評估了 69 種全基因組結構變異分析方法
八. 單細胞測序數據分析
- Kiselev, V.Y., T.S. Andrews, and M. Hemberg, Challenges in unsupervised clustering of single-cell RNA-seq data. Nat Rev Genet, 2019. 20(5): p. 273-282.
- McInnes, L., J. Healy, and J. Melville UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction. arXiv e-prints, 2018.
- Maaten, L.v.d.a.H., Geoffrey, Visualizing Data using t-SNE. Journal of Machine Learning Research, 2008. 9: p. 2579--2605.
- Lake, B.B., et al., Integrative single-cell analysis of transcriptional and epigenetic states in the human adult brain. Nat Biotechnol, 2018. 36(1): p. 70-80.
- Cusanovich, D.A., et al., A Single-Cell Atlas of In Vivo Mammalian Chromatin Accessibility. Cell, 2018. 174(5): p. 1309-1324 e18.
- Haghverdi, L., et al., Batch effects in single-cell RNA-sequencing data are corrected by matching mutual nearest neighbors. Nat Biotechnol, 2018.
- Raj, B., et al., Simultaneous single-cell profiling of lineages and cell types in the vertebrate brain. Nat Biotechnol, 2018. 36(5): p. 442-450.
- Edsgard, D., P. Johnsson, and R. Sandberg, Identification of spatial expression trends in single-cell gene expression data. Nat Methods, 2018. 15(5): p. 339-342.
九 .非編碼區及同義突變分析
- Fredriksson, N.J., et al., Systematic analysis of noncoding somatic mutations and gene expression alterations across 14 tumor types. Nat Genet, 2014. 46(12): p. 1258-63.
- Weinhold, N., et al., Genome-wide analysis of noncoding regulatory mutations in cancer. Nat Genet, 2014. 46(11): p. 1160-5.
- Uszczynska-Ratajczak, B., et al., Towards a complete map of the human long non-coding RNA transcriptome. Nat Rev Genet, 2018.
- Chamary J V, Parmley J L, Hurst L D. Hearing silence: non-neutral evolution at synonymous sites in mammals[J]. Nature Reviews Genetics, 2006, 7(2): 98.
- Sauna Z E, Kimchi-Sarfaty C. Understanding the contribution of synonymous mutations to human disease[J]. Nature Reviews Genetics, 2011, 12(10): 683.
- Supek F, Miñana B, Valcárcel J, et al. Synonymous mutations frequently act as driver mutations in human cancers[J]. Cell, 2014, 156(6): 1324-1335.
- Sharma, Y., et al., A pan-cancer analysis of synonymous mutations. Nat Commun, 2019.10(1): p. 2569.
十. 泛基因組
- Li, R., et al., Building the sequence map of the human pan-genome. Nat Biotechnol, 2010. 28(1): p. 57-63.
- Duan Z, Qiao Y, Lu J, et al. HUPAN: a pan-genome analysis pipeline for human genomes[J]. Genome biology, 2019, 20(1): 149.
十一. 三維基因組
- Spielmann, M., D.G. Lupianez, and S. Mundlos, Structural variation in the 3D genome.Nat Rev Genet, 2018. 19(7): p. 453-467.
如果你有好的論文或者書籍推薦,可以關注科研貓微信公眾號在後臺留信息反饋,謝謝。
不會 R 語言也可以畫出高端大氣的
科研圖
科研繪圖神器—hiplot,全網首個開源繪圖平臺,目前可提供70餘種基礎可視化功能,並在不斷的更新中。
點擊圖片進入Hiplot平臺介紹
免費註冊hiplot帳號(免費名額有限)步驟:
1、領取註冊邀請碼(Invitation code):關注「hiplot」微信公眾號,後臺回復「hiplot」。(註:edu教育郵箱註冊可免填註冊邀請碼)
2、註冊網址:https://hiplot.com.cn/signup
科研貓
(ID: DoctorTommy)
推薦理由:
科研貓公眾號,國內外頂尖高校博士及PI聯手打造的科研共享中心,涵蓋生物信息、實驗技能、統計繪圖等內容的一體化平臺,不斷放送科研乾貨,現已推出《R語言入門》、《科研繪圖》、《生物信息數據挖掘》、《機器學習》等多個系列,廣受粉絲歡迎。
團隊開發的Hiplot繪圖系統也受到科研人員的極大讚賞,日點擊率達到上萬人次。
https://hiplot.com.cn
關注公眾號後,
回復【hiplot】可獲取註冊激活碼,免費成為hiplot會員,實現一鍵作圖;
加客服微信可免費領取科研乾貨。
往期乾貨推薦(關注公眾號,加客服微信領取)