您的位置:首页 > 其它

使用WDL执行GATK HaplotypeCaller教程

2018-03-22 10:33 232 查看
Introduction

这里的workflow叫做
helloHaplotypeCaller
;包含一个单任务即是GATK’s HaplotypeCaller。这个task输入一个file
inputBAM
,输入一个file
rawVCF


Workflow

在workflow里,我们会执行task并指定task的执行顺序。

workflow helloHaplotypeCaller {

call haplotypeCaller

}


Task

例子,比如像GATK RefFasta, sampleName, inputBAM是核心输入。同时GATK会自动寻找支持文件如an index & dictionary for the reference, and an index for the bam:

task haplotypeCaller {

File GATK

File RefFasta

File RefIndex

File RefDict

String sampleName

File inputBAM

File bamIndex

command {

java -jar ${GATK} \

-T HaplotypeCaller \

-R ${RefFasta} \

-I ${inputBAM} \

-o ${sampleName}.raw.indels.snps.vcf

}

output {

File rawVCF = "${sampleName}.raw.indels.snps.vcf"

}

}


Running the pipeline

先生成input文件:

java -jar wdltool.jar inputs helloHaplotypeCaller.wdl > helloHaplotypeCaller_inputs.json


在input文件填写具体信息,比如:

"workflow.task.variable" : "Type"


改为

"helloHaplotypeCaller.haplotypeCaller.RefFasta" : ".../helloHaplotypeCallerBundle/ref/human_g1k_b37_20.fasta"


执行运行:

java -jar cromwell.jar run helloHaplotypeCaller.wdl -i helloHaplotypeCaller_inputs.json


参考
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: