您的位置:首页 > 数据库

使用KOG数据库进行注释

2016-05-26 22:03 1556 查看
进行KOG注释的方法和COG一致。对真核生物使用KOG注释:

$wget ftp://ftp.ncbi.nih.gov/pub/COG/KOG/kyva
$makeblastdb -in kyva -dbtype prot -title kog -parse_seqids -out /opt/biosoft/ncbi-blast-2.2.28+/db/kog -logfile /opt/biosoft/ncbi-blast-2.2.28+/db/kog.log

$cat /opt/biosoft/ncbi-blast-2.2.28+/db/kog.log

然后,使用Blastp将基因组蛋白质序列比对到COG数据库

$blast.pl blastp kog proteins.fasta 1e-5 4 kog 5

$blast.pl blastp kog proteins.fasta 1e-5 4 cog 5

下载KOG数据库的koghefun.txt文件。kog文件包含KOG编号和KOG数据库中序列名的对应关系,也包含KOG编号和25个大类的对应关系;fun.txt是25个大类的描述性信息。我们根据这2个文件的信息来编写程序对Blast的结果进行处理,得到KOG注释。

$mkdir ~/bin/kog

$wget ftp://ftp.ncbi.nih.gov/pub/COG/COG/whog -P ~/bin/kog

$wget ftp://ftp.ncbi.nih.gov/pub/COG/COG/fun.txt -P ~/bin/kog

$kog_from_xml.pl kog.xml 1e-5
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: