您的位置：首页 > 其它

20160420-序列比对前的准备工作

2016-04-20 12:49 267 查看

Hello,大家好！1周不见，甚是想念啊！

在之前的文章中，我们已经为大家介绍了高通量测序技术的原理，储存格式，使用FastQC做质量控制的方法。那么在使用FastQC之后，如果我们发现了一些问题（序列质量不高，），那么我们该使用什么样的工具，去解决这些问题呢？这就是今天我们要干的事情。

测试数据：

为了方便大家学习高通量测序分析，我为大家准备了一个测试数据，是双端测序的fastq文件，每个文件包含50W条reads。以后我们所有教程中展示的结果全部都来自于这1组测试数据。下载地址如下。
http://pan.baidu.com/s/1dEQsSnB 提取码7pmi

fastx Toolkit

fastx Toolkit是包含处理fastq/fasta文件的一系列的工具，它是基于java开发的，我们高通量测序最常用到的是使用这个软件进行reads的裁剪（trim）。它的安装可以根据官网的指南进行：
http://hannonlab.cshl.edu/fastx_toolkit/index.html
在这里我们就不再赘述。下面我们对这个工具箱中的工具，具体的命令进行一个简要的介绍。

<p><strong>FASTQ-to-FASTA</strong></p><p>$fastq_to_fasta -h</p><p>使用形式:fastq_to_fasta [-h] [-r] [-n] [-v] [-z] [-i INFILE] [-o OUTFILE]</p><p>[-h] = 获得帮助信息.</p><p>[-r] = 使用序号去代替fastq文件中原来的reads名.</p><p>[-n] = 如果fastq中有N，保留.（默认是有N的序列删除）</p><p>[-v] = 报告reads的总数</p><p>[-z] = 调用GZip软件，输出的文件自动经过压缩.</p><p>[-i] = 输入文件，可以是fastq/fasta格式.</p><p>[-o] =输出路径，如果不设置会直接输出到屏幕.</p>

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航