生信學習資料整理

2021-02-20 共享我們的大腦

先祝大家:除夕快樂~

今天想介紹的是我們比較關心的生信學習。生信和R語言並不缺學習資料,缺的往往是明確的方向和學習計劃。

目前網上關於生信的資料非常多,但琳琅滿目的教程並不一定是好事,其中最突出的問題是大部分資料很零散,沒有經過框架性的整理和組織。這些資料很適合入門後的進階學習,好比研究生在擁有科研思維後能快速從海量文獻裡找到自己感興趣的內容。而在入門之前,繁雜且缺乏組織的資料只會讓人無所適從。本次的內容主要匯總當前的一些生信學習資料,由於有我個人學習方向的偏向性,內容肯定不全面。希望能得到大家的支持,提醒我動態補充內容,贈人玫瑰手留餘香,非常感謝!

1、主要的公眾號

由於本公眾號的內容以及我個人的學習都是依靠jimmy老師和他的生信技能樹,這裡先做介紹。生信技能樹目前建立了相對成熟和完整的知識體系,有比較活躍的交流圈,並保持著公益的初衷,對於生信入門和進階者來說都是很好的選擇。

當然,小孩子才做選擇,成年人全都要。其他公眾號的內容也是值得學習的,除了內容和風格的互補,集百家之長也可以激發一些新的idea。單細胞天地也是一個比較大的平臺,產出內容豐富且專業。另外還有解螺旋旗下的新晉生信平臺挑圈聯靠,善於對生信相關知識進行拆解分析。

接下來的公眾號個人了解並不是很多,偶爾看看感興趣的推送,此處排名無先後,隨機的,大家自行選擇。

2、其他論壇、博客等

除了公眾號還有其他平臺和圈子,潛伏著很多無私的內容生產者(當然也存在個別勤懇的搬運工)。不過海量的內容分散在各大論壇和博客,很難收集。這裡介紹幾個主要的網站(考慮到語言和網絡的問題,國外的只提了Github這種必備的),排名也不分先後,不過個人最喜歡簡書,因為我學的東西比較基礎。這些網站也是百度最常指向的網站,大家可以自取所需:

簡書

知乎

B站

新浪微博

CSDN

Github

博客園

3、可視化網站

目前可視化網站越來越多,對於輕度生信依賴的人來說完全夠用。部分網站的功能還在不斷擴展,除了常規的作圖可視化,還可以直接做分析,十分的友好和實用!這類網站越來越多了,只介紹幾個常見的:

Hiplot:https://hiplot.com.cn/

仙桃love:https://www.xiantao.love/

Dr.Tom:https://biosys.bgi.com/#/report/login

歐易雲平臺:https://cloud.oebiotech.cn/task/

ImageGP:http://www.ehbio.com/ImageGP/

NetworkAnalyst:https://www.networkanalyst.ca/

其他優秀的網站歡迎補充~

4、生信教程

由於網絡上的資料過於分散,而紙質的教程看起來又非常晦澀,這裡只介紹生信技能樹發布的,免費並已經形成體系的教程。目前很明確,不希望大家成為漫無目的生信資料收藏家。。。我原來也是個優秀的微信收藏家,後來發現不實質性的投入時間,收得再多也沒用啊。。。

A、Linux/ubuntu系統基礎

生信入門環境的:https://www.bilibili.com/video/BV1cJ411e7UH

生信伺服器的:https://www.bilibili.com/video/BV1XW411d7Bp

生信軟體的:https://www.bilibili.com/video/BV1ps411M7UZ

電腦配置參考視頻

https://www.bilibili.com/video/av80872684

必備軟體安裝,根據自己的作業系統選擇

騰訊微云:

https://share.weiyun.com/564ke1c 密碼:gh8ca7

百度網盤:

https://pan.baidu.com/s/1upnRTXwkI0hvxuuA2Gm49w 提取碼: cnrv

R包安裝,跟著指引來:

http://www.bio-info-trainee.com/3727.html  

3個小測序教學視頻:

https://share.weiyun.com/5dLV9A7 密碼:wsstn9  

B站視頻,主要是linux和R基礎:

https://space.bilibili.com/338686099

如果只是生物信息學需要,請看第2~9章節,就是到P30即可:

https://www.bilibili.com/video/av40331948/

生物信息學之linux,視頻連結:

https://www.bilibili.com/video/av28813815 

LINUX的練習題

最低要求是完成linux 20題

http://www.bio-info-trainee.com/2900.html

其次完成生物信息學數據格式的習題 (blast / blat / fa-fq / sam - bam / vcf /bed /gtf-gff),收集這些格式的說明書。

fasta和fastq格式文件的shell小練習 

http://www.bio-info-trainee.com/3575.html

sam和bam格式文件的shell小練習 

http://www.bio-info-trainee.com/3578.html

VCF格式文件的shell小練習 

http://www.bio-info-trainee.com/3577.html

 

B、R語言及GEO數據分析

R語言鏡像

options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor/")

options("repos" = c(CRAN="http://mirrors.cloud.tencent.com/CRAN/"))

options(download.file.method = 'libcurl')

options(url.method='libcurl')

R全套資料

GEO資料庫挖掘課程,代碼在:

https://github.com/jmzeng1314/geo

如果網絡很差,就下載打包版本的geo代碼:

https://share.weiyun.com/5vrfsqv

並且一定要做作業,比如:

https://mp.weixin.qq.com/s/4VP8fK5rTRW9aiJwYFxzNw

配套教學視頻在B站:

https://www.bilibili.com/video/av26731585/

還有一個公共資料庫挖掘:

https://www.bilibili.com/video/av37568990

視頻應該是都在:

https://www.bilibili.com/video/av25643438/

 

如果是需要安裝R包,請務必參考:

http://www.bio-info-trainee.com/3727.html

專門為R語言建立了 GitHub 倉庫存放相關學習路線指導資料:

https://github.com/jmzeng1314/R_bilibili

 

生信基石之R語言,B站10小時教學視頻

參考 GitHub 倉庫存放的相關學習路線指導資料:https://github.com/jmzeng1314/R_bilibili

可以參考一些優秀筆記,比如:

https://mubu.com/doc/2KUiSCfVsg

 

相關習題

初級10 個題目:

http://www.bio-info-trainee.com/3793.html  

中級要求是:

http://www.bio-info-trainee.com/3750.html

高級要求是完成20題:

http://www.bio-info-trainee.com/3415.html

統計專題 30題:

http://www.bio-info-trainee.com/4385.html

可視化專題30題:

http://www.bio-info-trainee.com/4387.html

 

C、單細胞數據分析

全網第一個單細胞課程(免費基礎課程)

免費學習地址在B站:

https://www.bilibili.com/video/av38741055

務必聽課後完成結業考核20題:

https://mp.weixin.qq.com/s/lpoHhZqi-_ASUaIfpnX96w

課程配套資料文檔在:

https://docs.qq.com/doc/DT2NwV0Fab3JBRUx0

 

技能樹出品的第二個單細胞課程(進階課程,仍然免費)

 詳情請自行閱讀介紹:

https://mp.weixin.qq.com/s/bLfO-8ri_SNUepGs4UwRQw

本課程長期答疑文檔:

https://docs.qq.com/doc/DT0FxbEpHYU5ZVlpu

因為課程涉及到知識點太多,所以我拆分成為了5個子課程,歡迎B站提問彈幕交流!全部連結是:

「生信技能樹」單細胞進階數據處理之文獻導讀,連結是:

https://www.bilibili.com/video/BV17f4y1R7N8

「生信技能樹」使用10X單細胞轉錄組數據探索免疫治療,連結是:

https://www.bilibili.com/video/BV1xD4y1S74P

「生信技能樹」單細胞基因組數據拷貝數變異分析流程,連結是

https://www.bilibili.com/video/BV1Yf4y1R75R

「生信技能樹」雲伺服器處理單細胞轉錄組數據,連結是:

https://www.bilibili.com/video/BV154411Z7DU

「生信技能樹」使用Smart-seq2單細胞轉錄組數據探索小鼠性腺發育,連結是:

https://www.bilibili.com/video/BV1454y1q77Z

 

基礎課程學完後需要完成作業:

https://mp.weixin.qq.com/s/lpoHhZqi-_ASUaIfpnX96w

就是熟練掌握5個R包,需要熟練掌握它們的對象,而且分析流程也大同小異: 

scater,monocle,Seurat,scran,M3Drop

 

step1: 創建對象

step2: 質量控制

step3: 表達量的標準化和歸一化

step4: 去除幹擾因素(多個樣本整合)

step5: 判斷重要的基因

step6: 多種降維算法

step7: 可視化降維結果

step8: 多種聚類算法

step9: 聚類後找每個細胞亞群的標誌基因

step10: 繼續分類

我都是這樣教導學生完成單細胞學習的

D、學徒作業系統

生信技能數的學徒作業已經非常成熟,讓新手在學習的同時也能獲得更多分享和交流的機會:

https://mp.weixin.qq.com/s/b3rR--dUwAZSvibF07-WQQ

最後再說明下:

本篇收集的資料皆是優秀的大佬們產出的內容。

目前收集的資料還非常不全面,希望大家多多參與和提建議。

本篇的內容將持續更新,內容結構也會根據收集內容的變化不斷調整,希望最後能列出一個入門和進階學習的總提綱,讓大家目的更明確,跟頭翻更少。

多謝大家的支持!還是那句話,贈人玫瑰手留餘香,讓我們把知識共享起來。如果有心寫點東西麻煩私聊我,除了在我們自己的公眾號推送,好的主題還可以考慮提交到生信技能樹參與交流。

另外想對還沒入門但有強烈需求的童鞋們說,學習生信一定要行動起來啊,臨淵羨魚不如退而結網。

祝大家除夕開心~新年快樂~



相關焦點

  • 免費資源 | 這份100多GB的生信資料等你領取
    或者入門生信後不知道怎麼進一步提升自己,關於這些都是沒有頭緒的。於是,我幫大家把學習生信過程中比較有用的資料分享出來。從生物訊息學基礎知識、各個層次的分析技術、程式語言,以及資料庫的挖掘,乃至最後的實踐,這些我都已經幫大家整理好了。
  • 資料|78G史上最全生信禮包,適合生信愛好者和愛鑽研的小夥伴
    目前關於生信的資料小助理都整理完畢,請提前準備好內存哦,裡面還有壓縮包沒有全部解壓,拿到手後按照提示繼續解壓即可,特別適合用來打基礎和進行擴展學習的生信愛好者和愛鑽研的小夥伴,學習不費力~生物信息學入門書籍必看-經典:百讀不厭,每一本都是學習生信的好讀物
  • 免費Linux系統和生信寶典原創學習教程
    Linux對我們來講最重要的是它強大的命令行功能,可以快速、批量、靈活的處理數據的提取、統計和整理等耗時耗力的重複性工作。事實上在日常生信分析中,多數整理工作也都是用Linux命令的組合完成的,相比於寫完整的Python或Perl程序更簡便快捷;另外,生信分析用到的工具大都只在Linux下運行,而Linux發行版眾多,更新速度不一,軟體的安裝是一個令人頭大的事情。
  • 精心整理(含圖版)|你要的全拿走!(R數據分析,可視化,生信實戰)
    本文首發於「生信補給站」公眾號,更多關於R語言,ggplot2繪圖,生信分析的內容,敬請關注小號。為了能更方便的查看,檢索,對文章進行了精心的整理。建議收藏,各取所需,當前沒用也許以後就用到了呢!一 R資料+計劃R語言精品資料年中無套路贈送 R-plotly|交互式甘特圖(Gantt chart)-項目管理/學習計劃二 Bioinfo
  • 學習生信的系列教程
    但生信學習不是一朝一夕就可以完成的事情,也許你可以很短時間學會一個交互式軟體的操作,卻不能看完程序教學視頻後就直接寫程序。也許你可以跟著一個測序分析流程完成操作,但不懂得背後的原理,不知道什麼參數需要修改,結果可以出來,卻把我不住對還是錯。學習生信從來就不是一個簡單的事,需要做好持久戰的心理準備。
  • 大三上學期資料整理好了
    病生:《病生兼言》,總結得不錯。寄生蟲:《寄生蟲法寶三件裝》,理論複習必備,但是我覺得不太完善,大家最好補充一下;《寄生蟲實驗考試-答案被覆蓋》,標本複習必備;《!如果找不到什麼文件就後臺留言一下,因為網盤一直被和諧,我都不知道我最後到底怎麼把文件搗鼓上去的…(整理文件只花了幾個小時,處理網盤和諧的問題花了我兩個晚上你敢信?)QQ群號碼125940588,入群方式:備註年級+學院+姓名,如18中山醫xxx,否則不予通過。
  • 整理試卷,試卷是最好的學習資料
    上次考試沒有考出好成績,此後,小雨在學習方面就更加用功。她很清楚,媽媽這麼鼓勵她,可不是讓她懈怠的。此後的幾次考試中,小雨的成績都呈現出穩步上升的趨勢,眼看著就要期末考試了,小雨不免緊張起來,她很怕再次在考試中失利。這一次,她可沒有把握媽媽還可以對她娓娓道來。
  • 送書 | 知乎閱讀300w+的生信學習指南(更新版)
    生信的作用越來越大,想學的人越來越多,不管是為了以後發展,還是為了解決眼下的問題。但生信學習不是一朝一夕就可以完成的事情,也許你可以很短時間學會一個交互式軟體的操作,卻不能看完程序教學視頻後就直接寫程序。也許你可以跟著一個測序分析流程完成操作,但不懂得背後的原理,不知道什麼參數需要修改,結果可以出來,卻把握不住對還是錯。
  • 2021年最新生信SCI分析思路鑑賞
    因為,說不定你看著看著,你的文章也小修發表了~生信文章一年一個行情還是說慢了,隨著生信SCI的流行,好像半年就開始變化了:2019年,純生信隨便發,2020年上半年,純生信還能發,下半年,都多少要求補驗證。有機會學習的學員,可別再拖延了,行情不等人啊~會越來越不好發的...
  • 分享一下從接觸生信到發文章的體會
    對於剛上博士的我,一下子還很難投入到實驗課題中去,就這麼渾渾噩噩,一學期完了,轉眼到了2018年3月,博士一年級下學期開始了,突然有一天有一個同學晚上在實驗室拿了一篇生信三區3分的文章給我看,而且不需要做實驗,關鍵是連程式語言基礎都不需要,直接在線網站各種運用,就這麼整合出一篇sci文章了。
  • 【課程預告】手把手教你入門生信——The Biostar Handbook
    我曾經在《小白生信學習記》裡多次推薦和引用一個網絡課程:http://www.personal.psu.edu/iua1/courses
  • 高中數學:全部知識點整理(超經典),值得收藏學習的好資料
    高一數學是高考的基礎,掌握數學知識點將對高考複習起到重要作用,為方便同學們複習高一數學知識點,給大家分享關於高一數學的複習技巧方法和知識點整理,是很全面的內容,一定要好好看看。高一數學的知識點較多,高一試題約佔高考得分的70%,只有把高一的數學掌握牢靠,後面學習才能遊刃有餘。因此,高一數學的學習應該在熟記概念的基礎上,多做練習,穩紮穩打,只有這樣才能學好數學。
  • 獻給生信初學者的 Linux 教程
    這是一套導論性質的視頻,其目的是教會你如何去學習,相信在聽完本課程並輔以一定的自學和練習之後,你就可以驕傲地對自己的家人、朋友、同事說:我會 Linux 啦!為何說此課程是「生信初學者的福音」?此次課程的講師是澳門大學博士在讀的曾健明(Jimmy)老師,同時也是生信技能樹創始人。作為菜鳥團博主和論壇創始人,曾健明老師從最初與大家分享自己的生信的學習筆記及心得體會,到後來積極促進生信的學習和交流,一直堅持從入門到進階幫助到每一位生信人。受到了學生們的一致好評:
  • 江門檔案複印_佛山市速信檔案整理服務有限公司
    江門檔案複印,佛山市速信檔案整理服務有限公司,在建設工程資料編制指導和培訓、規劃建設系統業務管理檔案、建設工程竣工檔案業務指導、培訓、整理、分類、編目、檔案著錄、檔案數位化整理等領域積累了豐富的行業經驗。
  • 3年的自學感悟:從生物到生信到機器學習
    對於一個不擅忽悠的我,只能埋頭技術,如饑似渴、夜以繼日(略有誇張啦,不過確實有不少夜裡起來學習)地自學生信和機器學習(因為喜歡,所以不倦),從最初的天書到現在能自建pipeline到troubleshooting,從察覺到他人pipeline的大坑小坑到知道如何從坑裡爬出來到重構pipeline填平坑地,從翻開數學就合上到自學線性代數、資訊理論到重學概率論、統計學,從編程盲人到自學
  • 第119期,操作學習資料整理成冊項目實操教程,月入萬元。
    項目導讀學習資料,尤其是考研考公務員等應試類資料,往往是非常稀缺和有著廣闊的消費市場。這裡我們所說的不是普通的學習資料,而是整理一些專業性的資料,包裝成冊,比如高考狀元筆記整理錄,比如常見的100個公務員考試問題匯集,比如單證員考試常見問題匯集等等,然後通過某寶列印成冊,寄給有需要的朋友的整個過程。這個項目的核心在於放大學習資料本身的價值,讓價值最大化,消費者才會心甘情願的去付費購買。
  • 掏心掏肺的資料整理竅門
    資料的搜集和整理是自學提高的重中之重,一個混亂的資料庫,發揮的學習推動作用可能不到最大效力的5%。面對不同格式的資料,整理的第一步是對他們進行「樹形圖」的分類,第二是「文本與圖形的分類」。比如從根目錄下分: 「語言學習 、科學學術、人文學術、私人文件、低級趣味 」 這樣五個大類。注意大類的書目不宜大於10個,否則不便於自己查找;也不宜少於3個,否則分類的效率會比較低。每個大類再細分小類,儘量做到大類的子類之間也沒有重複主題
  • 鄭州【整理收納師學習】培訓課程_美舍整理貨真價實
    鄭州【整理收納師學習】培訓課程,美舍整理貨真價實,學員學成之後即可變現,提供實操實習機會,分享實戰經驗,誠邀各個城市創業者地區合夥制,攜手打造國內整理界標杆品牌。鄭州【整理收納師學習】培訓課程, 資料整理組主要負責專業資料搜集、整理工作;外語提升組主要為學術研究提供基礎保障。
  • 淺談資料整理的小技巧
    現在拿到的資料大部分都是2020年的我發現這些資料更適合衝刺的時候使用(知識點比較粗略)現在開始複習的小夥伴
  • 三月發表的百篇生信精華文章,一次帶你全領悟!
    小編通過PubMed整理了今年3月最新通過TCGA資料庫挖掘發表的生信文章,共250篇文章。小編嘔血看了五天四夜,篩選出近百篇有意思的生信文章濃縮至本篇推送,分享給大家。相信看完這篇推送後你也能夠get到很多生信靈感。