入門生物信息,門在哪?

2021-02-15 生信菜鳥團

前段時間接二連三帶了不少實習生和輪轉生,發現有些內容總需要重複的說,一件事情連續說三遍就效率太低了,還是把一些東西寫下來,以後直接丟過去一個連結和微笑就好。

這一篇內容列舉幾個入門生物信息的角度可以讓想要入門的夥伴知道門在什麼地方。另一篇文章會相對全面的列舉生物信息學常用軟體和方法。需要說明的是,文章本身不會涉及太多細節。你既可以把它當成一個入門學習清單,也可以用來對照查找自己的知識盲區。

無論是入門生物信息還是學習其他技能,其實關鍵就在於掌握自主學習的工具和方法。

學會學習再去學習,學什麼都不是問題。

生存必備基本技能學會Google

學會如何正確搜索,接下來的內容就全都不愁了。但如何使用Google也許並非像大部分人想的那麼簡單。

學會Google的前提是能用上Google,這裡點到為止,開源軟體可以用XXnet https://github.com/XX-net/XX-Net,如果有條件也可以使用微屁恩。

如何搜索日常遇到的bug

入門生物信息初期最大的困惑就是每跑一個軟體沒運行一個命令都會遇見各種各樣的問題,好像我們天生就是來和bug相遇的。但是沒關係,你遇到的絕大多數問題早就有人遇到而且已經解決了。

利用Google搜索bug的時候,基本的搜索內容只要包括你的報錯簡單信息加上所用軟體再加上版本,就能找到解決辦法了。如果要在相關社區提問,附上你的原始碼和幾行有問題的原始文件是基本的禮貌和要求。

習慣用英文來搜索

如果一個問題用中文搜不出來你想要的答案,還是用英文來搜索吧。

簡單常用技巧

用雙引號「搜索內容」進行精確搜索

很多時候,我們需要使用精確搜索,比如在進行一些常用軟體安裝或者使用的過程中會出現各種各樣的報錯,這時你把軟體的報錯信息用雙引號括封裝,後面再加上軟體的名字和版本,Google就會進行精確的匹配搜索。很可能第一條搜索結果就是你要的。

-搜索內容進行排除搜索

在一些情況下,一個主題詞往往會和若干個內容關係密切。這時候我們希望明確排除某個我們不想要的內容。

具體文檔類型搜索

這個技巧當你在想要查找具體類型文檔的時候非常有用。如你想要pdf版本的只需要在搜索內容的最後加上 filetype:pdf

指定網站搜索

對於碼農而言 stackoverflow.com 是一個常用的網站,對於生物信息工作者來說biostar是一個非常好的論壇。如果我們想在某個特定的網站進行搜索的話,你可以在搜索內容之後加上site:*.com*,你得到的答案就全部來自這個網站了。

學會記錄

可能會用到的工具

作為一個很愛丟筆記本的人,實在是不敢把什麼都寫在本子上了,其實主要原因是字太醜。

印象筆記是我用了多年的雲筆記,配合vs code 的印象筆記插件可以方便的使用Markdown來書寫並進行保存。當然,其他雲筆記只要你用的慣都可以。

我的印象筆記已經有兩千多條各種各樣的筆記了,印象筆記裡的東西越來越多,如果需要純粹理思路的時候會顯得臃腫。

思維整理,大綱類筆記我一直使用幕布(類似於 WorkFlowy 的國產應用),比如這篇文章的大綱就是在幕布中完成的,你可以複製連結https://mubu.com/doc/5MGyymO3J 或者點擊閱讀原文查看。

這類筆記工具非常輕量,各種端秒同步;而且你只需要也只能寫一個個的list,每個list邏輯很清晰,先是什麼再是什麼一目了然。還能一鍵生成思維導圖分享給別人。如果你總是需要做presentation,或者總是做事情沒有頭緒,可以嘗試一下這個工具。

markdown

學會了markdown 你就再也不想用office word,再學一些LaTeX 基本語法就更好了。使用markdown進行寫作目前來看也算是一個生物信息入門者必備技能了,相關介紹可以查看博客 http://kaopubear.top/2017-02-04/2017-02-04-trymarkdown/

基本語法學習地址 http://wowubuntu.com/markdown/

關於markdown編輯器的選擇有很多,這裡推薦且及推薦 typora https://typora.io/ ,當然,使用各種編程常用編輯器再配合插件也是可以的。

文獻管理

讀研究生少不了看文獻,關鍵是怎麼快速找到自己曾經度過的內容。

推薦使用Mendeley https://www.mendeley.com,基礎版本不收費且顏值高同步快上手簡單。也可以直接使用 Google學術,打造自己的線上圖書館。其實就是類似與收藏網頁一樣把看過的文獻收藏在谷歌學術裡。

另外F1000 http://f1000.com/prime 是個不錯的網站,文獻下載如果實在有困難可以考慮sci-hub http://sci-hub.cc/

包含有生物信息相關文章的常用期刊,CNS和PNAS就不多說了。其它還有:

學會收集信息

這裡想強調的一點就是學會使用RSS,目前生物信息相關的博客有不少,很多優秀的博客其實都支持RSS訂閱,另外常見的網站如biostar和學術期刊也都支持RSS定於,讓他們更新的內容每天自動來你的RSS閱讀器中報導,方便快捷。我目前在用的RSS閱讀器是inoreader。

下面是真正和生物信息緊密相關的內容,注意,這些只是門,不會具體寫每個門怎麼進去。

伺服器使用

軟體如果是windows系統,首先要讓自己的電腦連上伺服器。

作業系統

linux

ubuntu http://cn.ubuntu.com/download/

雙系統管理工具 vmware workstation

下載地址 https://www.vmware.com/products/workstation.html

參考學習資料推薦

生物信息入門基本知識

數據產生

數據存儲類型

資料庫資源

擬南芥

水稻

rapdb http://rapdb.dna.affrc.go.jp/

msu http://rice.plantbiology.msu.edu/

ricexpro http://ricexpro.dna.affrc.go.jp/

其他物種

NCBI

ENSEMBL

蛋白

EBI http://www.ebi.ac.uk/services/proteins

pfam http://pfam.xfam.org/

uniprot http://www.uniprot.org/

GPOFILER http://biit.cs.ut.ee/gprofiler/index.cgi

GO http://www.geneontology.org/

生物信息工具查詢網站

https://bioinformatics.ca/links_directory/

https://omictools.com/

https://www.atum.bio/resources/bioinformatics-tools

https://wiki2.org/en/List_of_RNA-Seq_bioinformatics_tools

生物信息統計入門基礎

基本概念

統計方法

實現方法

結果可視化

相關軟體算法實現

編程基礎生物學基礎知識


其他推薦:師妹 你要的都在這裡了
點擊閱讀原文,即可到達作者的博客。

還有更多文章,請移步公眾號閱讀

如果你生信基本技能已經入門,需要提高自己,請關註上面的生信技能樹,看我們是如何完善生信技能,成為一個生信全棧工程師。

如果你是初學者,請關注下面的生信菜鳥團,了解生信基礎名詞,概念,紮實的打好基礎,爭取早日入門。

相關焦點

  • 生物信息學從入門到研究完全手冊
    半年前,我開始接觸生物信息學,但學了一段時間,總覺得懸在空中,紙上談兵。
  • 李春才《信息醫學》入門精講網課上線!
    信息醫學屬於現代天人哲學範疇,高新科技。論述的核心內容,大體是「唯象論」;取材於人生命悠悠相關部分。宇宙現象奇妙無窮,有的現象一時難以理解,現代科學也無力檢測;類似諸多難點,若用跨越思維的方式進行探索,大膽設想、細心求證、不畏艱難、勇於實踐……從諸多現象中也可尋找一些規律。從分析現象而取得經驗和深化了的意識,稱之為「唯象論」。
  • 生物信息神奇網站系列(四):Biostars
    biostars其實是一個問答網站,與國外很多IT技術或者數據分析的熱門問答網站類似,例如stackoverflow,不過biostars是專注於生物信息類的問答
  • 入門必備!生物信息學資料庫大全
    http://iubio.bio.indiana.edu/eugenes 原核生物基因組: ★細菌基因組計劃的進展情況,可從以下網站查詢: http://www.ncbi.nlm.nih.gov/PMGifs/Genomes/bact.html ★MOT ,歐洲生物信息研究所EBI的基因組測序進展表。
  • 親測:入門款LV選哪只合適?
    但如果是第一次選購奢侈品包包,入門款無疑還是比較穩妥的一種選擇啦。 一般來說,入門款的LV大家提的比較多的還是nano、Felicie、Neverfull這幾隻。
  • 五大學科競賽之信息學奧林匹克競賽,一旦入門就會上癮的競賽項目
    競賽語言:C++02信息學競賽名人信息技術行業應用中,在信息檢索(搜尋引擎同樣是在信息檢索領域,今日頭條「抓住」了在UCAI、AAAI等頂級會上發表多篇論文,曾把人工智慧的邏輯推理提高了60-100倍的吳翼(IOI 2010 銀牌)。
  • 苦於入門克蘇魯神話?
    《瘋狂山脈》漫畫非常忠實於原著,卻又加入了畫師自己的思考,田邊剛的風格偏向歐美現實風,人物刻畫細膩寫實,大開頁更是張力十足,用極致的分鏡構圖將各種不可名狀之物震撼地展現在讀者面前,仿佛來自群星之物通過書頁之門降臨於世間。
  • 生物信息學專業:生物+計算機(高考家長每日必讀),No.85
    學什麼呢:最核心課程三大部分:生物學、數學、計算機科學課程有:生物化學、分子生物學、概率統計、數據結構及實驗、基因組信息學、轉錄組信息學、蛋白質組信息學、計算機輔助藥物發現、現代統計與生物信息學。所以,還是那句話,除非你特別明確想研究生物,否則生物信息學慎重考慮。而且,從當初高中老師的角度來講,學生物信息學可就不如學生物科學好了。
  • 美國生物統計專業解析
    生物統計是近年來的美國留學熱門專業之一。生物統計學就是用統計方法研究分析生物、醫學上的數據,屬於一個跨學科專業,跟生物統計信息,尤其是 data mining等關係密切。統計是一種萬金油學科,只要掌握了方法,在很多地方都能用,目前統計系出來就業情況也很好,特別是生物統計領域。
  • 生物信息學/計算生物學相關從業者建議讀哪些書籍和論文?
    生物信息學/計算生物學這門學科所包含的內容實在過於龐大和繁雜,你幾乎不可能同時掌握所有細分領域。機器學習的生物信息學應用全基因組數據分析單細胞數據分析非編碼區及同義突變分析泛基因組三維基因組......
  • 《饑荒》蟻獅在哪 蟻獅位置一覽
    導 讀 《饑荒》蟻獅位置在哪?
  • GL8的頭號勁敵,雙側電滑門+航空座椅,標配矩陣大燈,入門僅18萬
    現在的MPV車雖然是受歡迎的選擇,但實際上是合理的,除了可以應對商務用途外,其空間性和舒適性比乘用車的車型和SUV車更優秀,裡面有更多的娛樂設施,還有更多的娛樂設施,雖然有很強的競爭力,但是國產車中也有很好的新生代表,那麼,今天的車可以說是GL8最大的勁敵,兩側有電滑門+氣動座椅和矩陣燈,入門只有18萬,這輛車是上汽大通g20。
  • 生物科學與生物技術所學內容有什麼區別,都側重哪方面?
    問題:生物科學與生物技術所學內容有什麼區別,都側重哪方面?  學姐宋佳頤:內容上生物技術多了一門發酵工程學,但其實本科期間兩者課程差別不是太大,只有在碩博期間分的更細的時候差別才會明顯。從專業整體來看,生物科學是生物技術的上遊,偏重於理論研究。
  • 餘弦相似度及其生物信息學應用
    前面我們搜索了解到,cosine similarity(餘弦相似度)最常見的應用就是計算文本相似度,那麼,為什麼生物信息學領域裡面的cosmic的signature的相似性要採用cosine similarity(餘弦相似度)而不是常見的簡單的相關性係數呢?
  • 所有生物感染病毒產生變異,在幾秒內你會選擇哪個門逃出求生呢
    在病毒感染你之前,你只有幾秒鐘的時間來決定你應該選擇哪條路。你應該選擇哪扇門?救援直升機在另一邊等你喲!你正在研究一種可怕的病毒,不料因為失誤導致病毒外洩,這種病毒會使地球上所有的生物產生變異,這些生物變異後兇猛無比!
  • 想快速入門NLP?我們測評了15門最火課程,幫你找到最適合的
    我理想中的NLP課程是這樣的:圍繞著實踐問題展開的;只涵蓋對實踐有用的信息,夾雜一些更深入的理論知識作為補充資料;內容是與時俱進的,至少每次業界有重大新聞,它都能及時更新相應內容;由一群業界經驗豐富的專家編寫的;包含能解決業務實際問題的真實代碼。但理想很豐滿,現實……很骨感。
  • 學了這麼久C/C+,還沒有入門?
    首先是語言的選擇,C/C++,百度應該有很多的,如果你剛剛入門,那麼請專注於你所學的那一門語言,專注,無論它現在是否流行。 在沒有開發出幾個窗體程序之前,請準備好足夠的耐心,最好把耐心的技能樹給點滿了。
  • 生物信息百Jia軟體(十五):rnammer
    通哥點評rnammer是用來預測原核與真核生物核糖體序列的程序,使用起來非常簡單,直接給基因組序列即可。
  • 這幾本生信入門書籍你不能不知,附下載連結
    uk=1208225235&shareid=404590447生物信息分析相關的書籍: Liunx作業系統:生物信息分析大多數軟體都是在Liunux系統下運行,因此必須學會Linux作業系統。鳥哥的Linux私房菜
  • 斬掉三屍,就能達到入門境界
    儘管有哪都通公司員工身份,但唐門卻態度強硬,幸虧張楚嵐機智,賣了全性,得到唐門好感。更關鍵的是,唐門門主唐妙興反利用張楚嵐,在張楚嵐來了之後,認為自己已經天時地利人和,終於要跨出完成丹噬的一步。這其中利用了來襲的全性,在屍魔襲擊唐門子弟之後,引出了唐門弟子的三屍,得到了契機。唐門作為異人界最強大的門派之一,他們的憂患不在於外,而是內部分裂。