生物信息學之初學者(四)

2021-03-02 學術咖

其實妨礙大家進行生物信息學學習的一個比較關鍵的地方就是編程了。生物信息學是大數據科學,這就要求必須具備一定的編程思想,會採用電腦程式從龐大數據中挖掘有效信息。這就要求我們會基礎編程,並且更重要的需要我們精通的是會安裝和使用生物信息學軟體。

首先計算機編程這一塊有時候也是比較重要,畢竟不能手工進行處理龐大的數據吧。其實編程這一塊主要是為了結果過濾,畢竟軟體出來的往往並不能滿足自己想要的結果,這就需要對軟體出來數據進一步深挖過濾,拿到真正對自己有用的數據。

編程這一塊有人推薦學perl,有人推薦Python,無所謂了,關鍵看你周圍的人用什麼編程,方便在遇到問題時能夠及時的解決。

編程雖重要,但小編認為對於初學者軟體使用更重要。

大家都是生物狗,軟體一些參數用法結合一下生物學意義相對來說容易理解,但是可能對大家比較困難的是軟體用之前的工作--軟體安裝

由於不同的軟體需要的依賴(包括種類和版本)不同或者使用的是公用計算機集群你根本無權限安裝,導致軟體安裝不成功。

稀奇古怪的報錯信息,對於生物狗們真好似一頭霧水!好不容易有個好軟體但是不能用!所以大家需要掌握一些軟體安裝的技巧與方法。

本處主要講你沒有權限安裝方法,即安裝到自己目錄下面方法(有權限安裝通用)

我們運行一些Perl程序時經常出現找不到某個module。對於這種報錯,缺哪一個就下載哪一個或者看看軟體包有沒有此模塊直接給路徑添加即可。

首先下載所需要的模塊,像本處為Keith module,這樣我們谷歌或者CPAN((http://search.cpan.org/))上下載Keith.pm即可。

運行命令:

perl Bin/trf_wrapper.pl

報錯信息:

Can't locate Keith.pm in @INC (you may need to install the Keith module) 

(@INCcontains: /share/nas2/genome/biosoft/perl/current/lib//5.20.0/x86_64-linux-thread-multi/share/nas2/genome/biosoft/perl/current/lib//5.20.0/share/nas2/genome/biosoft/perl/current/lib/)

at Bin/trf_wrapper.pl line 13.

BEGIN failed--compilation aborted at Bin/trf_wrapper.pl line 13.

解決方案:

只需要在trf_wrapper.pl中調用的Keith模塊(use Keith;)之前加入下面黃色部分即可,其中PATH為模塊Keith.pm所在的目錄。

BEGIN{

push (@INC,"PATH/");

}

use Keith;

我們運行一些R語言程序時經常出現找不到某個package。對於這種報錯,缺哪一個就下載哪一個。

首先下載所需要的package,像本處為ggplot2,這樣我們谷歌或者bioconductor(http://www.bioconductor.org/)或者CRAN(https://cran.r-project.org/)上下載ggplot2即可。

運行命令:

Rscript heatmapV2.R

報錯信息:

Error in library(ggplot2) : there is no package called 'ggplot2'

解決方案:

下載到ggplot2_2.2.1.tar.gz,然後用下面命令(針對無管理員權限,安裝自己目錄下)安裝即可。

R CMD INSTALL ggplot2_2.2.1.tar.gz

注意安裝log:

installing to /home/xxx/R/x86_64-unknown-linux-gnu-library/3.1/ggplot2_2.2.1 /libs


安裝完成後添加環境變量:

export LD_LIBRARY_PATH=/share/nas2/genome/biosoft/hdf5/1.8.9/lib/:$LD_LIBRARY_PATH

注意使用的python版本,Python2與Python3差別較大,因此安裝時注意python版本。

運行命令:

/Python/3.5.2/bin/python suppa.py

報錯信息:

Traceback (most recent call last):

File "suppa.py", line 9, in <module>

import fileMerger as joinFiles

File "/share/nas1/SUPPA-master/fileMerger.py", line 11, in <module>

import pandas as pd

ImportError: No module named 'pandas'

解決方案:

找到對應版本的pandas下載即可,文件格式一般為後綴名為.tar.gz:

pandas-0.20.1.tar.gz

安裝步驟:

tar zxvf pandas-0.20.1.tar.gz

cd pandas-0.20.1

python setup.py install --user

安裝完成後注意在.bashrc中添加環境變量,

PYTHON_PATH=/home/xxx/.local/lib/python3.5/site-packages/:$PYTHON_PATH

無root權限的linux系統上安裝軟體時候遇到的lib××× not found的問題.

1. 安裝軟體到自己的軟體目錄。                                         

缺乏的lib×××庫大多都能在網上下載到源碼,可自己下載安裝。下圖是我在伺服器上的目錄結構,軟體都安裝在~/local/app裡面,在~/local/bin裡面分別建立軟連結指向所安裝軟體的可執行文件;如果該軟體裡面的可執行文件太多,方便的做法是講其所在目錄加入到環境變量$PATH中。

2. 設置環境變量

有的軟體安裝後只生成可執行文件,有的則產生一些庫文件和頭文件,則需要將其添加到相應環境變量中;share目錄等可忽略。如下所示

注意:等號前面不要有空格。本例中,~/local/app/libevent/lib中包含了動態和靜態連結庫,不確定編譯器類型,故加入到gcc和g++頭文件搜索目錄中。

參考:環境變量部分參考自:

http://hi.baidu.com/irainfish/item/35b054d8a3faa61dd78ed090

2017-06-25 生物信息學之初學者(一)

2017-07-10 生物信息學之初學者(二)

2017-07-29 如何不做實驗發IF 5分的文章

2017-08-08 生物信息學之初學者(三)

作者簡介:生信人團隊:成立於14年6月份。主要業務為生信技術服務和分析,軟體開發,平臺構建,目前已與幾十家單位建立合作關係。團隊主創人員均為一線科研工作者,策劃的生信人網站集結了一批有著生信經驗的技術人員,致力於打造新型的科研服務模式,以技術服務為基礎,以技術培訓和資料庫平臺開發為優勢,專注服務醫學科研用戶,為科研工作保駕護航。微信公眾號: 生信人。


來源 | 生信人團隊授權發布

供稿 | 學術咖編輯部

編輯 | 小咖咖

相關焦點

  • 生物信息之程序學習
    作為本科學生物,後來轉行生物信息的人,經常會被人問起,為啥學習生物信息了呢?這背後通常會帶著一些困惑,生物信息分析好不好學?
  • 【專業解讀】生物信息學:培養生物醫學大數據分析人才
    南方醫科大學於2005年在生物醫學工程學院開辦了生物信息學本科專業,2009年10月生物信息學本科專業移交基礎醫學院管理,2010年10月在基礎醫學院成立了生物信息學系,以加強對生物信息學本科專業的教學管理和學生培養。2012年申報設置了生物信息學二級交叉碩士、博士學位授予點。生物信息學系目前具有學士、碩士和博士的系列培養能力。
  • 獻給生信初學者的 Linux 教程
    重要的事情要先說:本課程由史上最大的生物信息學交流平臺「生信技能樹」聯盟和「丁香通
  • 生物信息分析入門全攻略
    生物信息學是生命科學研究的重大前沿領域,未來將佔據生命科學研究的半壁江山。已經有越來越多的小夥伴投入到生物信息的學習中,但是入門難、深入慢、摸不到方向等都成為持續學習的攔路虎。本文根據生物信息技術大牛成長經歷和華大人才培養經驗總結入門攻略,帶領小夥伴們全面破解生物信息學習難題。
  • 李衍達院士、孫之榮教授榮獲中國生物信息學終身成就獎
    清華新聞網10月6日電 9月27日,在上海舉行的第九屆全國生物信息學與系統生物學學術大會開幕式上,清華大學信息科學技術學院教授李衍達院士、生命科學學院教授孫之榮榮獲中國生物信息學學會(籌)頒發的首批中國生物信息學終身成就獎。
  • 生物信息學專業:生物+計算機(高考家長每日必讀),No.85
    學什麼呢:最核心課程三大部分:生物學、數學、計算機科學課程有:生物化學、分子生物學、概率統計、數據結構及實驗、基因組信息學、轉錄組信息學、蛋白質組信息學、計算機輔助藥物發現、現代統計與生物信息學。報考建議:生物信息學專業比生物科學、生物技術好的地方就是學了計算機相關課程,所以就業能去現在比較火的IT行業。但問題是,如果你想去IT行業就業,那直接學計算機不更好嘛。
  • 「專業解讀」生物信息學:培養生物醫學大數據分析人才
    南方醫科大學於2005年在生物醫學工程學院開辦了生物信息學本科專業,2009年10月生物信息學本科專業移交基礎醫學院管理,2010年10月在基礎醫學院成立了生物信息學系,以加強對生物信息學本科專業的教學管理和學生培養。2012年申報設置了生物信息學二級交叉碩士、博士學位授予點。
  • 生物信息就該這麼學(6):我唯一推薦的生物信息書籍
    這麼多年總有人想讓我推薦一些生物信息的書籍,想通過閱讀書籍來學習生物信息。
  • 小伊老師邀請你一起探討生物信息學本科教育
    成為了各大高校的青椒(聽說是比較悽慘的)了,也有很多朋友本來就是經驗豐富的生物信息學本科專業班主任,推薦了不少學生關注我們生信技能樹。這樣就會有一個信息差,因為全國各地的高校單位都開始開設生物信息學本科,但是卻沒有那麼多經驗成熟相關專業教學人才,所以剛入行的青椒會特別苦惱,沒有地方討論教學環節設置,課程選擇等等。
  • Python開發難學嗎?適合初學者嗎?
    Python開發難學嗎?適合初學者嗎?Python入門階段零基礎學員打好基礎是非常重要的。
  • 2007全國生物信息學研究生暑期學校將在清華舉行
    、清華大學承辦的2007年全國生物信息學研究生暑期學校,將於7月26日至8月25日在清華大學舉辦,175名正式學員屆時將聆聽來自國內外的多名著名專家和學者主講的課程和學術報告。來自美國冷泉港實驗室、美國哈佛大學、印度統計學院、北京大學、清華大學等知名學府和研究院的傑出科學家將主講《計算基因組學前沿專題》、《人類疾病的關聯分析:方法與實例》、《多變量統計方法及在生物信息學中的應用》、《蛋白質結構與功能研究基礎》等課程,美國科學院院士、美國南加州大學教授、生物信息學的奠基人之一Michael  S.
  • 「疫情下的生物信息學」線上學術研討會舉行
    國家自然科學基金委信息學部主任張兆田、生命學部副主任谷瑞升和兩個學部的處長潘慶、宋朝暉和王璞玥,以及來自全國45所高等院校和科研院所的100多位生物信息學領域的專家學者參加會議。 新冠肺炎疫情期間,我國生物信息學領域的廣大學者做了大量有意義的工作。
  • 清華大學生物信息學與系統生物學講席教授組國際學術研討會召開
    Waterman領導的生物信息學與系統生物學講席教授組是學校最成功的教授組之一,通過對生物信息學學術特區在學科規劃、學術文化、制度建設、隊伍建設、研究生培養、國際學術交流等方面的幫助,成功將他們所具有的學術智力等國際性外部優勢轉化為清華生物信息學師資隊伍、學術運行機制和研究生教育等方面的本土內在優勢,為清華在傳統工科中發展前沿與交叉學科研究探索出一條成功之道。
  • 生物信息神奇網站系列(四):Biostars
    biostars其實是一個問答網站,與國外很多IT技術或者數據分析的熱門問答網站類似,例如stackoverflow,不過biostars是專注於生物信息類的問答
  • 生物科學、生物技術、生物工程、生物醫學工程四個專業的區別
    實際情況到底怎麼樣,生物類專業到底能不能學,今天就來給大家分析一下。 我們一般說的生物類專業主要有生物科學、生物技術、生物工程、生物醫學工程這四個專業。但實際上,生物科學和生物技術屬於理學類專業,而生物工程和生物醫學工程屬於工學類專業。我們先來看看這四個專業所學的主要課程和就業方向。
  • 初學者怎麼學動漫繪畫?動漫初學者入門教程
    初學者怎麼學動漫繪畫?動漫初學者入門教程!零基礎小白學動漫繪畫,通常是比較困難的,很多時候都是靠一股熱血支撐,但由於種種原因, 那種激情就會消退,久而久之就學不下去了。面對這種情況,小白們也很無奈,所以今天,小編給小白們送福利啦!告訴你零基礎小白學動漫繪畫應該怎麼學。
  • 生物信息學常用研究軟體(二)
    生物信息學(Bioinformatics)是計算機科學與生命科學的交叉學科。
  • 高通量DNA測序數據的生物信息學方法
    面對如此迅速增長的龐大的短讀序列數據集,如何有效管理、分析、充分利用這些信息,已成為生物信息學發展亟需解決的問題[4]。圖 1   不同種類數據的近似增長趨勢2  生物大數據帶來的新挑戰隨著高通量測序技術的發展,各種生物學數據呈現爆炸式增長,並且這一趨勢將隨著生物測序技術的發展而進一步增強。
  • 日本兩位生物信息學專家訪問天津工生所
    3月18日,日本京都大學化學研究所生物信息學中心阿久津達也教授、九州工業大學竹本和宏助理教授來中科院天津工業生物技術研究所進行學術交流,並分別作了題為「基於核函數的藥物設計和分類方法」和「基於網絡理論的代謝進化和代謝適應的研究現狀」的學術報告。天津工生所結構生物信息學與整合系統生物學實驗室宋江寧研究員主持了報告會。
  • 信息架構初學者指南
    在本文中,我們將討論什麼是真正的信息體系結構,以及為什麼它是用戶體驗過程中一個有價值的方面。在此過程中,我們將共享創建信息體系結構時經常使用的歷史、貢獻者和工具。即使你已經熟悉了這門學科,你也可以學到一些你錯過的東西。目錄什麼是信息架構?