前段時間接二連三帶了不少實習生和輪轉生,發現有些內容總需要重複的說,一件事情連續說三遍就效率太低了,還是把一些東西寫下來,以後直接丟過去一個連結和微笑就好。
這一篇內容列舉幾個入門生物信息的角度 ,可以讓想要入門的夥伴知道門在什麼地方。另一篇文章會相對全面的列舉生物信息學常用軟體和方法。需要說明的是,文章本身不會涉及太多細節。你既可以把它當成一個入門學習清單,也可以用來對照查找自己的知識盲區。
無論是入門生物信息還是學習其他技能,其實關鍵就在於掌握自主學習的工具和方法。
學會學習再去學習,學什麼都不是問題。
生存必備基本技能學會Google學會如何正確搜索,接下來的內容就全都不愁了。但如何使用Google也許並非像大部分人想的那麼簡單。
學會Google的前提是能用上Google,這裡點到為止,開源軟體可以用XXnet https://github.com/XX-net/XX-Net,如果有條件也可以使用微屁恩。
如何搜索日常遇到的bug
入門生物信息初期最大的困惑就是每跑一個軟體沒運行一個命令都會遇見各種各樣的問題,好像我們天生就是來和bug相遇的。但是沒關係,你遇到的絕大多數問題早就有人遇到而且已經解決了。
利用Google搜索bug的時候,基本的搜索內容只要包括你的報錯簡單信息加上所用軟體再加上版本,就能找到解決辦法了。如果要在相關社區提問,附上你的原始碼和幾行有問題的原始文件是基本的禮貌和要求。
習慣用英文來搜索
如果一個問題用中文搜不出來你想要的答案,還是用英文來搜索吧。
簡單常用技巧
用雙引號「搜索內容」進行精確搜索
很多時候,我們需要使用精確搜索,比如在進行一些常用軟體安裝或者使用的過程中會出現各種各樣的報錯,這時你把軟體的報錯信息用雙引號括封裝,後面再加上軟體的名字和版本,Google就會進行精確的匹配搜索。很可能第一條搜索結果就是你要的。
用-搜索內容進行排除搜索
在一些情況下,一個主題詞往往會和若干個內容關係密切。這時候我們希望明確排除某個我們不想要的內容。
具體文檔類型搜索
這個技巧當你在想要查找具體類型文檔的時候非常有用。如你想要pdf版本的只需要在搜索內容的最後加上 filetype:pdf
指定網站搜索
對於碼農而言 stackoverflow.com 是一個常用的網站,對於生物信息工作者來說biostar是一個非常好的論壇。如果我們想在某個特定的網站進行搜索的話,你可以在搜索內容之後加上site:*.com*,你得到的答案就全部來自這個網站了。
學會記錄可能會用到的工具
作為一個很愛丟筆記本的人,實在是不敢把什麼都寫在本子上了,其實主要原因是字太醜。
印象筆記是我用了多年的雲筆記,配合vs code 的印象筆記插件可以方便的使用Markdown來書寫並進行保存。當然,其他雲筆記只要你用的慣都可以。
我的印象筆記已經有兩千多條各種各樣的筆記了,印象筆記裡的東西越來越多,如果需要純粹理思路的時候會顯得臃腫。
思維整理,大綱類筆記我一直使用幕布(類似於 WorkFlowy 的國產應用),比如這篇文章的大綱就是在幕布中完成的,你可以複製連結https://mubu.com/doc/5MGyymO3J 或者點擊閱讀原文查看。
這類筆記工具非常輕量,各種端秒同步;而且你只需要也只能寫一個個的list,每個list邏輯很清晰,先是什麼再是什麼一目了然。還能一鍵生成思維導圖分享給別人。如果你總是需要做presentation,或者總是做事情沒有頭緒,可以嘗試一下這個工具。
markdown
學會了markdown 你就再也不想用office word,再學一些LaTeX 基本語法就更好了。使用markdown進行寫作目前來看也算是一個生物信息入門者必備技能了,相關介紹可以查看博客 http://kaopubear.top/2017-02-04/2017-02-04-trymarkdown/
基本語法學習地址 http://wowubuntu.com/markdown/
關於markdown編輯器的選擇有很多,這裡推薦且及推薦 typora https://typora.io/ ,當然,使用各種編程常用編輯器再配合插件也是可以的。
文獻管理讀研究生少不了看文獻,關鍵是怎麼快速找到自己曾經度過的內容。
推薦使用Mendeley https://www.mendeley.com,基礎版本不收費且顏值高同步快上手簡單。也可以直接使用 Google學術,打造自己的線上圖書館。其實就是類似與收藏網頁一樣把看過的文獻收藏在谷歌學術裡。
另外F1000 http://f1000.com/prime 是個不錯的網站,文獻下載如果實在有困難可以考慮sci-hub http://sci-hub.cc/
包含有生物信息相關文章的常用期刊,CNS和PNAS就不多說了。其它還有:
學會收集信息這裡想強調的一點就是學會使用RSS,目前生物信息相關的博客有不少,很多優秀的博客其實都支持RSS訂閱,另外常見的網站如biostar和學術期刊也都支持RSS定於,讓他們更新的內容每天自動來你的RSS閱讀器中報導,方便快捷。我目前在用的RSS閱讀器是inoreader。
下面是真正和生物信息緊密相關的內容,注意,這些只是門,不會具體寫每個門怎麼進去。
伺服器使用軟體如果是windows系統,首先要讓自己的電腦連上伺服器。
作業系統
linux
ubuntu http://cn.ubuntu.com/download/
雙系統管理工具 vmware workstation
下載地址 https://www.vmware.com/products/workstation.html
參考學習資料推薦
生物信息入門基本知識數據產生
數據存儲類型
資料庫資源
擬南芥
水稻
rapdb http://rapdb.dna.affrc.go.jp/
msu http://rice.plantbiology.msu.edu/
ricexpro http://ricexpro.dna.affrc.go.jp/
其他物種
NCBI
ENSEMBL
蛋白
EBI http://www.ebi.ac.uk/services/proteins
pfam http://pfam.xfam.org/
uniprot http://www.uniprot.org/
GPOFILER http://biit.cs.ut.ee/gprofiler/index.cgi
GO http://www.geneontology.org/
生物信息工具查詢網站
https://bioinformatics.ca/links_directory/
https://omictools.com/
https://www.atum.bio/resources/bioinformatics-tools
https://wiki2.org/en/List_of_RNA-Seq_bioinformatics_tools
生物信息統計入門基礎基本概念
統計方法
實現方法
結果可視化
相關軟體算法實現
編程基礎生物學基礎知識
其他推薦:師妹 你要的都在這裡了
點擊閱讀原文,即可到達作者的博客。
還有更多文章,請移步公眾號閱讀
如果你生信基本技能已經入門,需要提高自己,請關註上面的生信技能樹,看我們是如何完善生信技能,成為一個生信全棧工程師。
如果你是初學者,請關注下面的生信菜鳥團,了解生信基礎名詞,概念,紮實的打好基礎,爭取早日入門。