samtools faidx 命令处理fasta序列
2016-02-19 12:56
901 查看
samtools faidx 能够对fasta 序列建立一个后缀为.fai 的文件,根据这个.fai 文件和原始的fastsa文件, 能够快速的提取任意区域的序列
用法:
samtools faidx input.fa
该命令对输入的fasta序列有一定要求:对于每条序列,除了最后一行外, 其他行的长度必须相同,
>one
ATGCATGCATGCATGCATGCATGCATGCAT
GCATGCATGCATGCATGCATGCATGCATGC
ATGCAT
>two another chromosome
ATGCATGCATGCAT
GCATGCATGCATGC
最后生成的.fai文件如下, 共5列,\t分隔;
one 66 5 30 31
two 28 98 14 15
第一列 NAME : 序列的名称,只保留“>”后,第一个空白之前的内容;
第二列 LENGTH: 序列的长度, 单位为bp;
第三列 OFFSET : 第一个碱基的偏移量, 从0开始计数,换行符也统计进行;
第四列 LINEBASES : 除了最后一行外, 其他代表序列的行的碱基数, 单位为bp;
第五列 LINEWIDTH : 行宽, 除了最后一行外, 其他代表序列的行的长度, 包括换行符, 在windows系统中换行符为\r\n, 要在序列长度的基础上加2;
提取序列:
samtools faidx input.fa chr1 > chr1.fa
samtools faidx input.fa chr1:100-200 > chr1.fa
用法:
samtools faidx input.fa
该命令对输入的fasta序列有一定要求:对于每条序列,除了最后一行外, 其他行的长度必须相同,
>one
ATGCATGCATGCATGCATGCATGCATGCAT
GCATGCATGCATGCATGCATGCATGCATGC
ATGCAT
>two another chromosome
ATGCATGCATGCAT
GCATGCATGCATGC
最后生成的.fai文件如下, 共5列,\t分隔;
one 66 5 30 31
two 28 98 14 15
第一列 NAME : 序列的名称,只保留“>”后,第一个空白之前的内容;
第二列 LENGTH: 序列的长度, 单位为bp;
第三列 OFFSET : 第一个碱基的偏移量, 从0开始计数,换行符也统计进行;
第四列 LINEBASES : 除了最后一行外, 其他代表序列的行的碱基数, 单位为bp;
第五列 LINEWIDTH : 行宽, 除了最后一行外, 其他代表序列的行的长度, 包括换行符, 在windows系统中换行符为\r\n, 要在序列长度的基础上加2;
提取序列:
samtools faidx input.fa chr1 > chr1.fa
samtools faidx input.fa chr1:100-200 > chr1.fa
相关文章推荐
- Matrix Chain Multiplication(表达式求值用栈操作)
- Item 47:使用Traits类提供类型信息
- leetcode 219: Contains Duplicate II
- http://demo.netfoucs.com/jianglonghuang/article/details/44888133
- China's WeChat Gaining Global Attention
- AID列表
- 对COM 组件的调用返回了错误 HRESULT E_FAIL
- 记录如何在Raid1+LVM的基础上再添加两块硬盘
- 使用行为树(Behavior Tree)实现游戏AI (转载)
- 从2月14号开始,打包的时候:Failed to locate or generate matching signing assets
- CodeForces Experimental Educational Round: VolBIT Formulas Blitz A. Again Twenty Five!
- hdu 2674 N!Again
- 对话DeepMind创始人:建立通用人工智能
- A. Again Twenty Five
- 签名APK后仍然出现INSTALL_PARSE_FAILED_NO_CERTIFICATES的解决方案
- HDU 3394 Railway 点双连通分量
- HDU 4300 Clairewd’s message
- 用find_if查找vector内对象的成员 http://blog.csdn.net/zhongguoren666/article/details/7629610
- STL中的find_if函数 http://blog.csdn.net/hj490134273/article/details/6051080
- sendEmail:出现的错误