Illumina下机数据bcl格式转为fastq
2016-10-22 10:12
2166 查看
BCL2FASTQ
Illumina刚下机的数据为bcl格式文件(per-cycle BCL basecall file),但是下游的分析一般都需要fastq格式文件,所以在进行下游分析之前,需要使用CASAVA软甲中的configureBclToFastq.pl将bcl格式的文件根据每个样本之前添加的index分出,并转为fastq格式的文件。在看bcl2fastq的说明文档时,会经常碰到一个词:demultiplexing,指的就是将multiplexed的reads根据index从不同或者同一个lane中分出,生成sample对应的fastq文件,这一步就涉及到输入正确的samplesheet.csv。
所有的步骤只使用一行代码就可以解决,首先贴出代码:
重要的一点 一个正确格式的输入:samplesheet.csv
![原始samplesheet来自测序人员]
Illumina刚下机的数据为bcl格式文件(per-cycle BCL basecall file),但是下游的分析一般都需要fastq格式文件,所以在进行下游分析之前,需要使用CASAVA软甲中的configureBclToFastq.pl将bcl格式的文件根据每个样本之前添加的index分出,并转为fastq格式的文件。在看bcl2fastq的说明文档时,会经常碰到一个词:demultiplexing,指的就是将multiplexed的reads根据index从不同或者同一个lane中分出,生成sample对应的fastq文件,这一步就涉及到输入正确的samplesheet.csv。
所有的步骤只使用一行代码就可以解决,首先贴出代码:
#PBS -N bcl2fastq #PBS -j oe #PBS -l walltime=5000:00:00 #PBS -l nodes=c15:ppn=10 #PBS -q low #PBS -j n nth=${PBS_NUM_PPN} outdir=/path/to/personaldir/to/store/fastqfile indir=/path/to/BaseCalls /usr/local/bin/configureBclToFastq.pl --no-eamss \ --use-bases-mask y51,I6nn,I0nnnnnnnn \ ###y51代表read长度,I6nn代表index长度为6且由于本次测序人员的个人习惯,后面会外加两个空碱基,I0nnnnnnnn代表只使用了一个index即为前面那个,此时仍需设定长度为8 --mismatches 1 \ --input-dir $indir \ --output-dir $outdir/raw \ --sample-sheet $outdir/sample.csv \ --fastq-cluster-count 0 --force cd $outdir/raw ###运行过程中会在输出目录产生产生MakeFile,需要指定到输出目录然后完成 * nohup make -j $nth ##可多线程运行
重要的一点 一个正确格式的输入:samplesheet.csv
![原始samplesheet来自测序人员]
相关文章推荐
- DataTable转为JSON数据格式代码
- 一种将数据表DataTable转为JSON格式的新方法
- JSON、JAVA互转与将页面中改变的数据转为json格式
- DataTable转为JSON数据格式代码
- 利用convert命令把硬盘格式FAT32转为NTFS(不影响硬盘数据哦)
- 表格转为JSON数据格式
- YUV420数据转为IplImage格式
- 好奇怪啊,如果邮箱JSON格式的字符串不是在一行上,那么转为JSON将转换不成功,估计是数据格式有问题吧
- DataTable转为JSON数据格式代码
- IOS开发时间格式转换之──C语言中time_t数据类型转为NSString类型
- 使用OGR2OGR将S57数据转为shp格式
- 使用OGR2OGR将S57数据转为shp格式
- JS转为json数据、.NET DataTable转化为json格式
- Excel中时间格式数据转为文本格式数据
- DataTable转为JSON数据格式代码
- 把实体 转为json 数据格式---jackson 的详细用法.
- java取模数据格式转换源码 宽高16*16 高位在前 转为 低位在前
- java对象、List转为json格式的数据
- C# 将格式为20150528的数据转为日期格式
- JQuery把日期格式的字符串转为日期数据