RNA-seq 流程、问题总结(一)
2012-10-31 09:44
225 查看
这是2012 年的3月份的一篇nature protocol
,下面是我作为一个RNA-seq 方面的菜鸟在根据这个protocol 跑流程时遇到的问题及解决的方法,现总结如下:
一、果蝇全基因组下载Fruit fly iGenome packages (Ensembl build; download via the TopHat and Cufflinks websites, along with packages for many other organisms; )
注意:Drosophila_melanogaster\Ensembl\BDGP5.25下面有三个文件夹 分别是 Annotation、GenomeStudio、Sequence 其中Annotation/Genes/genes.gtf中是注释文件 ,在
Sequence/BowtieIndex/genome.*是用Bowtie 建好的索引文件,以ebwt 结尾的文件,如果没有,就要自己用bowtie -build 命令来建立索引文件。
二、Downloading sequencing data:Raw sequencing reads, aligned reads, assembled transfrags and differential analysis are all available through the
Gene Expression Omnibus at accession GSE32038.
GEO 数据库的有关介绍:Gene Expression Omnibus(GEO)数据库
三、软件的下载安装,这里的软件大都可以直接下载解压后,把其中的文件copy 到bin 目录就好了,当然你也可以选择自己重新编译,但是会遇到各种问题(我没尝试过),Tophat 下载地址,cufflinks下载地址,例如cufflinks 下载解压后 把下面这四个文件copy
到bin目录下 。
四、Map the reads for each sample to the reference genome
说明: 1、这几条命令中每条包含三个文件,gtf 文件,索引文件,和sequence(.fq) 文件
2、这里的genome 就是上面说的Bowtie建立的索引文件
3、tophat参数详解
4、最后三条命令出错啦,用绿色把1改成2的部分
5、每个文件的路径,如果不确定的话就用绝对路径,这里的这种写法是这三个文件在同一个目录下
五、
六、
七、
这一步容易输出警告。
八、
这一步也容易出现问题,在SEQanswers上有详细解答,详见TopHat protocol error at cuffdiff。
,下面是我作为一个RNA-seq 方面的菜鸟在根据这个protocol 跑流程时遇到的问题及解决的方法,现总结如下:
一、果蝇全基因组下载Fruit fly iGenome packages (Ensembl build; download via the TopHat and Cufflinks websites, along with packages for many other organisms; )
注意:Drosophila_melanogaster\Ensembl\BDGP5.25下面有三个文件夹 分别是 Annotation、GenomeStudio、Sequence 其中Annotation/Genes/genes.gtf中是注释文件 ,在
Sequence/BowtieIndex/genome.*是用Bowtie 建好的索引文件,以ebwt 结尾的文件,如果没有,就要自己用bowtie -build 命令来建立索引文件。
二、Downloading sequencing data:Raw sequencing reads, aligned reads, assembled transfrags and differential analysis are all available through the
Gene Expression Omnibus at accession GSE32038.
GEO 数据库的有关介绍:Gene Expression Omnibus(GEO)数据库
三、软件的下载安装,这里的软件大都可以直接下载解压后,把其中的文件copy 到bin 目录就好了,当然你也可以选择自己重新编译,但是会遇到各种问题(我没尝试过),Tophat 下载地址,cufflinks下载地址,例如cufflinks 下载解压后 把下面这四个文件copy
到bin目录下 。
四、Map the reads for each sample to the reference genome
说明: 1、这几条命令中每条包含三个文件,gtf 文件,索引文件,和sequence(.fq) 文件
2、这里的genome 就是上面说的Bowtie建立的索引文件
3、tophat参数详解
4、最后三条命令出错啦,用绿色把1改成2的部分
5、每个文件的路径,如果不确定的话就用绝对路径,这里的这种写法是这三个文件在同一个目录下
五、
六、
七、
这一步容易输出警告。
八、
这一步也容易出现问题,在SEQanswers上有详细解答,详见TopHat protocol error at cuffdiff。
相关文章推荐
- ios app版本更新流程及问题总结
- RNA-SEQ分析流程文献收集ing
- android 休眠唤醒流程及定位唤醒问题总结
- axis webservice tomcat 服务发布总结之相关流程和问题汇总
- RNA-seq数据处理流程(以胶质瘤数据为例)
- android 休眠唤醒流程及定位唤醒问题总结
- 外部系统调用EAS 凭证webserivce标准接口问题总结以及流程
- iOS内支付总结__详解iOS应用程序内使用IAP/StoreKit付费、沙盒(SandBox)测试、创建测试账号流程!【2012-12-11日更新获取"产品付费数量等于0的问题"】
- 9个offer,12家公司,35场面试,从微软到谷歌,应届计算机毕业生的2012求职之路 IT公司面试的流程 面试该注意的细节问题 面试总结
- RNAseq 流程
- RNA-seq差异表达分析工作流程
- 分享一个程序猿在流程数据查看权限问题的总结
- RNA_Seq差异表达分析流程
- RNA-seq 基本分析流程
- 问题单走单流程经验总结
- RNA-seq流程报告
- RNA-seq 基本分析流程
- iOS APP上架流程及上架过程中遇到的问题总结
- 给大家总结一个海淘Thinkpad的流程、注意事项和常见问题
- 流程问题--12月17日总结