怎样学习生物信息学

怎样学习生物信息学

至少每个月都有人问我要我帮助他学习生物信息学。我非常乐意提供这样的帮助,因为这意味着他们想自己进行数据分析,而我便可以空出更多的时间干自己的事情。那么这篇文章便是一些技巧和资源的集合,目的在于帮助你学习生物信息学。

将这些事情铭记在心

学习生物信息学的基础十分容易。本文介绍的这些基础知识通常高中你就学过。但是当你对这些不能够一次理解清楚的时候,请不要灰心。学习新的东西总会花些时间,同时不亲自实践那学习也是很困难的。

学习一点点基础便可以帮助你解决很多问题。我估计自己90%的工作都可以用一些最基本的简单的预定程序完成。学习这些,便实际上可以极大的提升你分析和解释数据的能力。

Google是最好的老师。Google提供了大量的新技术和解决复杂问题的资源。如果你有问题需要向别人讨教,那么首先在Google上找找看。即使你有一些生物信息学相关的朋友,他们也不一定比Google厉害。

动手实践。对一些不确定的事情,最好的方法是动手实践,实际运行一下看看有什么结果。一般而言,敲一些小的代码不具有巨大的风险,除非你热爱rm命令。当然,对重要的文件和数据经常备份是一个好的习惯。

学习Unix基础

找到一台Unix电脑。不动笔墨不读书,同时工欲善其事必先利其器。如果你手头刚好有一台天天使用的Mac电脑,那么你就可以利用其内建的Unix shell直接开始学习。如果没有,找一台破电脑,装个开源的Linux/Unix系统,比如Ubuntu即可。当然你也可以在现存的Windows机上搞个双启动的Linux/Unix。

完成一些在线教程
Unix Tutorial for Beginners
Introduction to Unix for Biologists
Unix and Perl Primer for Biologists

买本书看看,如果你更喜欢看书的话。但是, 利用在线资源可能学习的更好。我喜欢的Unix书是Unix Power Tools

学习一门脚本语言

选择一门脚本语言。脚本语言是不用编译的计算机语言。两门最流行的脚本语言是PerlPython,虽然各有优缺点。不过我更喜欢Perl。

完成一门在线课程
Perl tutorial
Perl and Unix for Biologists
Python tutorial
Python for Biologists

买本书。我喜欢的Perl书是Damian Conway写的Perl Best Practices。这本书是所有Perl程序员的必备工具书。 至于Python方面的我没什么经验,所以买之前多看看书评就好了。

学习一门统计作图语言

选择一门能够进行统计分析和画图的语言RMatlab是首选。两门语言各有优缺点,但我更倾向于R语言。如果你选择R语言,我强烈推荐你使用ggplot2文库进行作图。

完成一门在线课程
R tutorial (ggplot tutorial) (another fantastic R tutorial by DataCamp)
Matlab tutorial

放弃Excel。Excel虽好但不灵活。虽然R和Matlab的学习曲线更加陡峭,但放弃Excel会促进你统计分析和画图的能力。

学习些基本的生物信息分析程序和对应的软件工具

例如
数据质量控制 fastQC
序列组装 Velvet SPAdes (我的最爱,参加这篇文章)
序列比对 BWA Bowtie
序列搜寻 BLAST
表达差异分析 edgeR DESeq
变异分析 GATK
等等。这些只是相关DNA序列分析的一小部分程序。参考OMICtools发现更全面的工具集。

发现问题并解决他

我强烈建议生物信息学新手利用这些原则和能力对真实的数据进行一些有意义的科学工作尝试与实践。如果你本身没有数据,我建议你从一些公共数据库中下载资源(例如Genbank)。当然另外一种方法就是选择一篇相关文章,然后利用其陈述的方法重新生成他们的结果。

这是一篇译文,原始文章见https://scottmyourstone.blogspot.com/2014/06/how-to-learn-bioinformatics.html


除非特别声明,文章均为牛会飞的博客原创,遵循署名-非商业使用-相同方式共享授权协议
转载请注明出处: https://blogfei.com/how-to-learn-bioinformatics/

暂无评论