您的位置:首页 > 其它

20160420-序列比对前的准备工作

2016-04-20 12:49 267 查看
Hello,大家好!1周不见,甚是想念啊!

在之前的文章中,我们已经为大家介绍了高通量测序技术的原理,储存格式,使用FastQC做质量控制的方法。那么在使用FastQC之后,如果我们发现了一些问题(序列质量不高,),那么我们该使用什么样的工具,去解决这些问题呢?这就是今天我们要干的事情。

 

测试数据:

为了方便大家学习高通量测序分析,我为大家准备了一个测试数据,是双端测序的fastq文件,每个文件包含50W条reads。以后我们所有教程中展示的结果全部都来自于这1组测试数据。下载地址如下。
http://pan.baidu.com/s/1dEQsSnB  提取码7pmi 

fastx Toolkit

fastx Toolkit是包含处理fastq/fasta文件的一系列的工具,它是基于java开发的,我们高通量测序最常用到的是使用这个软件进行reads的裁剪(trim)。它的安装可以根据官网的指南进行:
http://hannonlab.cshl.edu/fastx_toolkit/index.html
在这里我们就不再赘述。下面我们对这个工具箱中的工具,具体的命令进行一个简要的介绍。

<p><strong>FASTQ-to-FASTA</strong></p><p>$fastq_to_fasta -h</p><p>使用形式:fastq_to_fasta [-h] [-r] [-n] [-v] [-z] [-i INFILE] [-o OUTFILE]</p><p>[-h] = 获得帮助信息.</p><p>[-r] = 使用序号去代替fastq文件中原来的reads名.</p><p>[-n] = 如果fastq中有N,保留.(默认是有N的序列删除)</p><p>[-v] = 报告reads的总数</p><p>[-z] = 调用GZip软件,输出的文件自动经过压缩.</p><p>[-i] = 输入文件,可以是fastq/fasta格式.</p><p>[-o] =输出路径,如果不设置会直接输出到屏幕.</p>
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: