生物信息學/計算生物學相關從業者建議讀哪些書籍和論文?

2020-09-22 科研貓


生物信息學/計算生物學這門學科所包含的內容實在過於龐大和繁雜,你幾乎不可能同時掌握所有細分領域。

  • 生物學涉及的材料是複雜的,細胞、組織和器官,乃至個體;病毒、微生物、植物和動物;試劑/實驗材料的不同生產批次和生產廠家......
  • 生物學涉及的過程和反應是複雜的,DNA/RNA 複製、轉錄、轉錄後調控、逆轉錄、翻譯、翻譯後調控、代謝調控、激素調控、免疫調節、DNA/RNA/蛋白質/小分子化合物等物質間的相互作用......
  • 生物學處理和效應是複雜的,基因過表達和沉默、基因編輯和敲除、藥物和安慰劑、正常與畸形、存活與死亡、治癒與耐藥......
  • 生物數據的獲取方式和數據類型是複雜的,從簡單的生化儀器檢測的數值到定量和定性的組學測序結果,以及靜態和動態的圖像和影像等等。
  • 生物數據分析過程是複雜的,常常是一種檢測儀器就對應了一套數據分析方法。質量控制和評估,異常值檢測,數據標準化,統計變換、統計建模和統計檢驗幾乎樣樣都少不了。

讀書和閱讀不論從什麼時候開始都不算晚,它可以讓我們將知識變得更加結構化和系統化。筆者時常會感覺自己所掌握知識的淺薄,所以常常只能在搜書/文獻、看書/文獻、做項目/寫文章中尋找一些慰藉。


書籍分類


  • 生物學/醫學理論
  • 計算機基礎和程式語言
  • 數學基礎
  • 統計學習與算法
  • 分布式計算
  • ......


論文分類


  • 高通量測序技術基礎
  • 大型研究項目
  • 精準醫學
  • 腫瘤生物學
  • 生物信息學資料庫和分析工具
  • 機器學習的生物信息學應用
  • 全基因組數據分析
  • 單細胞數據分析
  • 非編碼區及同義突變分析
  • 泛基因組
  • 三維基因組
  • ......


書籍推薦列表



一. 生物學/醫學理論


  • 《Lewin 基因X(中文版)》([美]J.E.克雷布斯,[美]E.S.戈爾茨坦,[美]S.T.基爾派屈克)
  • 《正版 癌生物學 原書第2版 腫瘤生物學生命科學專著系列 腫瘤遺傳學腫瘤研究治療 詹啟敏癌症分子生物學》
  • 《基因組學(第4版)》(楊金水)
  • 《生物化學:基礎理論與臨床(原書第6版)(套裝上下冊)》
  • 《分子生物學(原書第五版)》([美]Robert F. Weaver)
  • 《藥物早期臨床試驗/藥物臨床試驗質量管理規範叢書(GCP)》(王興河)
  • 《物種起源 達爾文進化論生物信息學圖解科學了解生命是什麼自然史動植物生物學世界科普名著傳世經典書籍》
  • 《認知神經科學:關於心智的生物學》([美]葛詹尼加,等)
  • 《植物生物學》([英]Alison M. Smith,等)
  • 細胞生物學 翟中和 第四版 教材+輔導習題集 全2冊 細胞生物學考研學習指南習題精解》
  • 《發育生物學(第二版)》
  • 《生命科學史》([美]洛伊斯·N.瑪格納)
  • 《生命是什麼》([奧]薛丁格)
  • 《細胞生命的禮讚:一個生物學觀察者的手記 英文原版The Lives of a Cell》
  • 《自私的基因 40周年增訂版 平裝(見識叢書25)》([英]理察·道金斯(Richard Dawkins))
  • 《自然科學的哲學(當代世界學術名 ) (美)亨普爾,張華夏 中國人民大學出版社》
  • 《生物信息學(第三版)》(陳銘)
  • 《表觀遺傳學》([美]C.D.Allis,[德]T.Jenuwein,[美]D.Reinberg,[美]M.Caparros)
  • 《遺傳學戴灼華9787040220834》


二. 計算及基礎和程式語言


計算機基礎

  • 《計算機科學叢書:計算機組成原理》([英]艾倫·克萊門茨(Alan,Clements))
  • 《計算機科學叢書:編譯原理(第2版)》([美]Alfred V.Aho,[美]Monica S.Lam,[美]Ravi Sethi,等)
  • 《現代作業系統(原書第4版)》(Andrew S. Tanenbaum,Herbert Bos)
  • 《計算機網絡:自頂向下方法(原書第7版)》([美]James,F.Kurose,Keith,W.Ross)


Shell

  • 《Linux命令行與shell腳本編程大全(第3版) 》([美]布魯姆(Richard Blum),布雷斯納漢(Christine Bresnahan))
  • 《鳥哥的Linux私房菜 基礎學習篇 第四版》(鳥哥)


C/C++

  • 《C++ Primer Plus(第6版 中文版) 》([美]Stephen Prata)
  • 《C Primer Plus 第6版 中文版 》([美]史蒂芬·普拉達(Stephen,Prata))


Golang

  • 《 Go語言核心編程 Go語言編程入門教程書籍 golang教程實戰自學基礎入門精通實踐開發 go語言》
  • 《Go語言實戰》([美]威廉·甘迺迪(William,Kennedy)布賴恩·克特森(Brian,Ketelsen)埃裡克·聖馬丁(Erik,St.Martin))
  • 《Go語言高級編程》(柴樹杉,曹春暉)
  • 《Kubernetes權威指南:從Docker到Kubernetes實踐全接觸(第4版)》(龔正,吳治輝,崔秀龍,閆健勇)
  • 《Docker技術入門與實戰(第3版)》(楊保華,戴王劍,曹亞侖)


Java

  • 《Java編程思想(第4版) 》([美]Bruce Eckel)
  • 《華章專業開發者叢書·Java並發編程實戰 》([美]Brian Goetz,等)


R 語言

  • 《R語言核心技術手冊(第2版)》([美]Joseph Adler(約瑟夫·阿德勒))
  • 《文本挖掘:基於R語言的整潔工具》([美],茱莉亞·斯拉格(Julia,Silge),戴維·羅賓遜,[David,Robinson])
  • 《R語言實戰 第2版 》([美]卡巴科弗(Robert I. Kabacoff))


Python

  • 《Python學習手冊(套裝上下冊)(原書第5版)》([美],馬克·盧茨(Mark,Lutz))
  • 《利用Python進行數據分析(原書第2版) 》([美]韋斯·麥金尼(Wes,McKinney))
  • 《Python 3網絡爬蟲開發實戰》(崔慶才)
  • 《Python自然語言處理實戰:核心技術與算法》(塗銘,劉祥,劉樹春)
  • 《Bioinformatics with Python Cookbook》(Antao Tiago)


JavaScript/TypeScript

  • 《JavaScript權威指南(第6版)》([美]David Flanagan)
  • 《JavaScript高級程序設計(第3版) 》([美]Nicholas C.Zakas)
  • 《TypeScript實戰指南》(胡桓銘)
  • 《Web前端技術叢書:Vue.js快速入門》(申思維)
  • 《React學習手冊》(Alex,Banks,Eve,Porcello)


三. 數學基礎


  • 《普林斯頓微積分讀本(修訂版) 》([美]阿德裡安·班納)
  • 《線性代數(第5版)》([美]Gilbert Strang(吉爾伯特·斯特朗))
  • 《計算機科學叢書:離散數學及其應用(原書第7版)》([美]Kenneth H.Rosen)
  • 《最優化理論與算法(第2版)/清華大學研究生公共課教材·數學系列》(陳寶林)


四. 統計與算法/數據結構/機器學習/深度學習


  • 《統計學習方法(第2版)》(李航)
  • 《算法:C語言實現(第1-4部分)基礎知識、數據結構、排序及搜索(原書第3版)》
  • 《算法(第4版)》([美] Robert Sedgewick,[美]
    Kevin Wayne)
  • 《計算機科學叢書·數據結構、算法與應用:C++語言描述(原書第2版)》([美]薩特吉·薩尼(Sartaj Sahni))
  • 《數據結構與算法分析:Java語言描述(原書第3版)》([美]馬克·艾倫·維斯)
  • 《數據結構Python語言描述》([美]Kenneth,A.,Lambert,蘭伯特)
  • 《圖解數據結構--使用Python》(吳燦銘)
  • 《機器學習》(周志華)
  • 《機器學習基礎》(梅爾亞·莫裡(Mehryar,Mohri),阿夫欣·羅斯塔米扎達爾,等)
  • 《深度學習 》([美]Ian,Goodfellow,[加]Yoshua,Bengio,[加]Aaron,Courville)
  • 《TensorFlow:實戰Google深度學習框架(第2版)》

(鄭澤宇,梁博文,顧思宇)


五. 分布式計算


  • 《ZooKeeper:分布式過程協同技術詳解》([美]Flavio Junqueira,Benjamin Reed)
  • 《分布式緩存 原理、架構及Go語言實現》(胡世傑)
  • 《高性能分布式計算系統開發與實現:基於Hadoop、Scalding和Spark》([印度] 斯裡尼瓦沙(Srinivasa, K.G.), 阿尼爾·庫馬爾·穆帕拉(Anil Kuma)
  • 《分布式系統概念與設計》(George Coulouris,金蓓弘)


論文推薦列表


一. 高通量測序技術基礎

  • Hadfield, J. & Retief, J. A profusion of confusion in NGS methods naming. Nat Methods 15, 7-8 (2018): http://enseqlopedia.com/enseqlopedia/,測序技術的百科全書
  • Schuster S C. Next-generation sequencing transforms today&34;Comprehensive evaluation of structural variation detection algorithms for whole genome sequencing."Genome biology20.1 (2019): 117. 系統地評估了 69 種全基因組結構變異分析方法

八. 單細胞測序數據分析

  • Kiselev, V.Y., T.S. Andrews, and M. Hemberg, Challenges in unsupervised clustering of single-cell RNA-seq data. Nat Rev Genet, 2019. 20(5): p. 273-282.
  • McInnes, L., J. Healy, and J. Melville UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction. arXiv e-prints, 2018.
  • Maaten, L.v.d.a.H., Geoffrey, Visualizing Data using t-SNE. Journal of Machine Learning Research, 2008. 9: p. 2579--2605.
  • Lake, B.B., et al., Integrative single-cell analysis of transcriptional and epigenetic states in the human adult brain. Nat Biotechnol, 2018. 36(1): p. 70-80.
  • Cusanovich, D.A., et al., A Single-Cell Atlas of In Vivo Mammalian Chromatin Accessibility. Cell, 2018. 174(5): p. 1309-1324 e18.
  • Haghverdi, L., et al., Batch effects in single-cell RNA-sequencing data are corrected by matching mutual nearest neighbors. Nat Biotechnol, 2018.
  • Raj, B., et al., Simultaneous single-cell profiling of lineages and cell types in the vertebrate brain. Nat Biotechnol, 2018. 36(5): p. 442-450.
  • Edsgard, D., P. Johnsson, and R. Sandberg, Identification of spatial expression trends in single-cell gene expression data. Nat Methods, 2018. 15(5): p. 339-342.

九 .非編碼區及同義突變分析

  • Fredriksson, N.J., et al., Systematic analysis of noncoding somatic mutations and gene expression alterations across 14 tumor types. Nat Genet, 2014. 46(12): p. 1258-63.
  • Weinhold, N., et al., Genome-wide analysis of noncoding regulatory mutations in cancer. Nat Genet, 2014. 46(11): p. 1160-5.
  • Uszczynska-Ratajczak, B., et al., Towards a complete map of the human long non-coding RNA transcriptome. Nat Rev Genet, 2018.
  • Chamary J V, Parmley J L, Hurst L D. Hearing silence: non-neutral evolution at synonymous sites in mammals[J]. Nature Reviews Genetics, 2006, 7(2): 98.
  • Sauna Z E, Kimchi-Sarfaty C. Understanding the contribution of synonymous mutations to human disease[J]. Nature Reviews Genetics, 2011, 12(10): 683.
  • Supek F, Miñana B, Valcárcel J, et al. Synonymous mutations frequently act as driver mutations in human cancers[J]. Cell, 2014, 156(6): 1324-1335.
  • Sharma, Y., et al., A pan-cancer analysis of synonymous mutations. Nat Commun, 2019.10(1): p. 2569.

十. 泛基因組

  • Li, R., et al., Building the sequence map of the human pan-genome. Nat Biotechnol, 2010. 28(1): p. 57-63.
  • Duan Z, Qiao Y, Lu J, et al. HUPAN: a pan-genome analysis pipeline for human genomes[J]. Genome biology, 2019, 20(1): 149.

十一. 三維基因組

  • Spielmann, M., D.G. Lupianez, and S. Mundlos, Structural variation in the 3D genome.Nat Rev Genet, 2018. 19(7): p. 453-467.

如果你有好的論文或者書籍推薦,可以關注科研貓微信公眾號在後臺留信息反饋,謝謝。


不會 R 語言也可以畫出高端大氣的

科研圖

科研繪圖神器—hiplot全網首個開源繪圖平臺,目前可提供70餘種基礎可視化功能,並在不斷的更新中

點擊圖片進入Hiplot平臺介紹


免費註冊hiplot帳號(免費名額有限)步驟:

1、領取註冊邀請碼(Invitation code):關注「hiplot」微信公眾號,後臺回復「hiplot」。(註:edu教育郵箱註冊可免填註冊邀請碼)

2、註冊網址:https://hiplot.com.cn/signup


科研貓

(ID: DoctorTommy)

推薦理由:

科研貓公眾號,國內外頂尖高校博士及PI聯手打造的科研共享中心,涵蓋生物信息、實驗技能、統計繪圖等內容的一體化平臺,不斷放送科研乾貨,現已推出《R語言入門》《科研繪圖》《生物信息數據挖掘》《機器學習》等多個系列,廣受粉絲歡迎。

團隊開發的Hiplot繪圖系統也受到科研人員的極大讚賞,日點擊率達到上萬人次。

https://hiplot.com.cn

關注公眾號後,

回復【hiplot】可獲取註冊激活碼,免費成為hiplot會員,實現一鍵作圖;

加客服微信可免費領取科研乾貨。

往期乾貨推薦(關注公眾號,加客服微信領取


相關焦點

  • 生物信息學相關網站
    研究領域主要涵蓋序列分析,蛋白質組學和基因組學等。該網站提供了資料庫,電子論壇,教育,新聞,軟體,招聘啟事等。該網站還提供了相關連結,包括歐洲分子生物學以色列國家網點,以色列國家基因組基礎設施實驗室以及國際生物信息學合作中心。
  • 魏冬青——上海交通大學——生物信息學,計算生物學,計算化學...
    研究領域: 生物信息學,計算生物學,計算化學,計算機輔助藥物設計,計算與統計物理學 聯繫方式 E-Mail: dqwei@sjtu.edu.cn
  • ...信息學,基因晶片相關信息學技術,藥物基因組信息學和系統生物學
    ,基因晶片相關信息學技術,藥物基因組信息學和系統生物學 聯繫方式 E-Mail: profli@126.com       電話: 0451*******       郵編: 0 地址:
  • 2012年專業課考研課外輔導書籍雜誌:生物學
    全國公開發行的生物學教學專刊主要有《生物學通報》、《生物學教學》、《中學生物教學》和《中學生物學》等。為了節省同學們的查找時間,快速準確的定位哪些課外輔導書籍雜誌是自己所需要的,萬學海文專業課考研輔導專家們將為廣大2012年考研同學們提供一系列專業課考研輔導書籍雜誌。近年來,生物學相關學科成為考研熱門專業。競爭較為激烈,尤其是重點本科高校的生物學更是競爭激烈,每年都有很多人報考,但錄取的人卻相對少。除去保研錄取的名額,被錄取的概率很小。
  • 生物信息學專業:生物+計算機(高考家長每日必讀),No.85
    三個緯度講專業:1、學什麼;2、幹什麼;3、報考建議相信很多家長都沒聽過這個專業。算是新興學科。簡單來講,就是利用計算機來幫助解決生物學中遇到的各種問題。學什麼呢:最核心課程三大部分:生物學、數學、計算機科學課程有:生物化學、分子生物學、概率統計、數據結構及實驗、基因組信息學、轉錄組信息學、蛋白質組信息學、計算機輔助藥物發現、現代統計與生物信息學。
  • 生命科學與技術學院參與承辦第九屆全國生物信息學與系統生物學...
    9月26日至29日,由中國生物信息學學會(籌)主辦,同濟大學和復旦大學共同承辦的第九屆全國生物信息學與系統生物學學術大會舉行。來自全國生物信息領域及其相關領域的700餘名專家學者、研究人員和企業代表參加會議。顧祥林對生物信息學在生物學研究中,特別是在此次新冠肺炎疫情防控的溯源、傳播、診斷及治療等工作中的貢獻給予了充分肯定,介紹了同濟大學生物信息學發展的歷史與現狀,並對國內外同仁在我校生物信息學的發展中提供的幫助表示感謝。
  • 第九屆全國生物信息學與系統生物學學術大會在滬舉行
    來自全國各地的700餘名專家學者代表,圍繞「新冠病毒研究與轉化醫學信息學」、「計算、進化與比較基因組學」等12個方向和「腦科學與生物信息學」等4個新興方向進行研討與交流。中國科學院院士陳潤生致開幕詞,他在致辭中指出生物信息學已經從一個關注較少的領域發展為在生物學研究領域不可或缺的一部分。
  • 計算生物學
    計算生物學(Computational Biology)是指通過開發和應用數據分析的理論和方法、數學建模、計算機仿真等技術來研究生物醫學相關問題的學科
  • 科研大牛推薦的100本生物醫學方面的書籍,你確定不學習一下?
    今天小喵給大家帶來的是,一百本科研大牛推薦過的生物醫學方面的書籍,小喵覺得無論是醫學生還是醫生,都可以來學習學習噠!細胞凋亡的基礎和臨床 / 細胞培養技術 / 醫學細胞生物學 / 精編細胞生物學實驗指南 / 細胞生物學實驗技術 / 細胞培養 / 動物細胞培養 基本技術和特殊應用指南 / 流式細胞術 / 生命之窗生命科學前沿縱覽 細胞生物學 / 細胞生物技術實驗指南 / 細胞生物學 / 實用流式細胞術彩色圖譜 / 腫瘤分子細胞生物學 / 動物細胞培養:基本技術指南
  • 生物信息學專業十強
    生物信息學(Bioinformatics)是一門交叉科學,它包含了生物信息的獲取、加工、存儲、分配、分析、解釋等在內的所有方面,它綜合運用數學、計算機科學和生物學的各種工具,來闡明和理解大量生物數據所包含的生物學意義。
  • 張春霆院士榮獲首屆中國生物信息學終身成就獎 天津大學生物信息中心網站連續運行二十年
    9月27日,在上海開幕的第九屆全國生物信息學與系統生物學學術大會上,中國生物信息學學會(籌)授予張春霆院士首屆中國生物信息學終身成就獎,以表彰他所取得的重要學術成就和為我國生物信息學發展作出的巨大貢獻。
  • 計算生物學:從「什麼是」到「什麼不是」
    計算生物學的分支方向已經融入了生命科學的不同,甚至已經成為了基礎生物學密不可分的一部分,深度融入了從分子尺度到生態系統尺度的不同領域。因此,我們現在不會再問「什麼是計算生物學?」相反,回顧這些年來發表在該期刊的文章,更加合適的問題應該是「生命科學研究中,有沒有哪些領域和方向沒有涉及到計算生物學?」現在大多數的研究院所都會招募在計算生物學領域有所建樹的研究者。
  • 關於創新的書有哪些?創新相關書籍推薦
    關於創新的書有哪些?其實關於創新的書實在是太多了,多到讓人應接不暇,一般人很難有時間全部讀完。當然,也根本沒有讀完的必要。讀書只讀經典即可。讀太多創新相關的同類書籍反而是一種極大的時間與精力浪費。在親身試讀過無數本創新類的書籍後,今天小編就為大家推薦一本最具代表性的經典創新相關書籍:《創新必讀12篇》。首先,小編想說的是,這本來自12Reads的書僅能從信匯中正領導力官網購買,並且價格與同類書籍相比還有些小貴,但這絲毫沒有影響到小編對這本書的熱愛。相信對於很多人而言,真正能學到東西才是最重要的。
  • 第九屆全國生物信息學與系統生物學學術大會舉行—新聞—科學網
  • 推薦| 九本不容錯過的深度學習和神經網絡書籍
    選自aioptify機器之心編譯參與:微胖、李亞洲、蔣思源針對 30 多本深度學習和神經網絡書籍,我們(AI Optify 數據團隊)使用不同指標(比如,在線評價、打分、所涉主題、作者影響力、出版年份、社交媒體是否提及等)訓練機器學習算法,為每本書打分、排名。讀者可能會喜歡我們的推薦,因為這份榜單基於數據並且客觀。排名靠前的九本書如下。1.
  • 生物信息學為大數據 「插上翅膀」
    圖為陳潤生院士正在做報告「如今,生物信息學正扮演著越來越重要的角色,它也是資訊時代帶給生物醫學的巨大推動力。」8月3日,在第十四屆國際生物信息學論壇(IBW 2019)上,哈佛大學教授劉小樂表示,生物醫藥領域產生了海量的數據,如何通過生物信息學與計算科學弄懂這些數據,成為生命科學領域專家共同關注的話題之一。
  • 所有的生物學都是計算生物學
    計算生物學帶來了我們對生命的理解,它使生物學概念變得嚴格和可測試,它提供了一個參考範本,可以規範個人對生物學的見解。生物學中的下一個重大進化將由數學、統計和計算方法驅動,需要被吸收到主流生物培訓中,將生物學轉變為定量科學。
  • 生物學專業到底學什麼?畢業後能幹什麼?
    原標題:生物學專業到底學什麼?畢業後能幹什麼?從2003年人類的全部基因被解碼到2016年可以運用CRISPR/Cas9 技術篩選和改變包括人類的基因,我們對地球上生命物種的影響和改造日益增大。而急劇增加的人才需求也讓越來越多的學生選擇進入生物學,最終從事與生物相關的工作。
  • 餘弦相似度及其生物信息學應用
    本來呢,pearson,kendall以及spearman這3個相關性公式就讓人頭疼了,但是最近我在教程:比較不同的腫瘤somatic突變的signature 發現兩個不同算法的signature的相似性並不是和文章完全一致,原因是作者使用了一個cosine similarity(餘弦相似度)的概念
  • 賀福初——復旦大學——基因組學、蛋白質組學與生物信息學研究
    性別: 男       出生年月: 1962-01 所在院校: 復旦大學       所在院系: 生物學系 職稱: 院士       招生專業: 生物學