现有得到大批NCBI的基因名,如何批量得到他们对应的注释?

大家好,我通过分析得到了一批我需要的gene的ID,如何能批量的得到这些ID对应的注释呢?
例如我现在手头有:
XP_002509591.1
XP_002303700.1
XP_002332483.1
CAN73669.1
XP_002315858.1
XP_002311085.1
XP_002300370.1
XP_002513602.1
XP_002318926.1
XP_002319471.1
XP_002319730.1
、、、、
上万个ID。我希望得到的是他们在NCBI的注释如:
XP_002509591.1 DNA binding protein, putative
、、、、
一个个在ncbi去查注释我会,但ID太多,我需要批量的处理。请大神帮助:)谢谢
已邀请:

agonyr - QQ群 424014618

赞同来自: oooet Enzo conris

use Bio::DB::GenBank;
my $ob=new Bio::DB::GenBank;
while($ac=<>) # put accssion numbers into one file
{
chomp($ac);
my $info= $ob ->get_Seq_by_acc("$ac");
print $info->desc,"\n";
}

将你那些ID放一个文件里面,然后执行以上代码

tangsha1986 - 80后科研男

赞同来自: Enzo

上面那个要求对linux和perl有一定了解,我自己也在网上查到一个适合小白的方法,供大家参考。

用NCBI的工具Batch Entrez批量下载序列信息!
Batch Entrez网址:http://www.ncbi.nlm.nih.gov/sites/batchentrez

用这个工具,要求你有一个文件,里面是一个列表,可以是Accession Number,Gi Number,或是NCBI里其它数据库的各种标识符。

tangsha1986 - 80后科研男

赞同来自:

谢谢大神,这个用什么执行?bioperl么?貌似不是win下的?

youarecrazy

赞同来自:

你的问题搞定了吗?

Yamol - Bioinformatic PhD

赞同来自:

试试 DAVID的注释

hangch

赞同来自:

ensumble ,david的在线注释,bioconductor的annotation包,ncbi的eutils还有就是一楼bioperl

agonyr - QQ群 424014618

赞同来自:

程序都给你写好了,还不会用。。。无语了

1793682501qqcom - ZHAN z-h

赞同来自:

刚刚才在虚拟机上安了bioch,还不会用

要回复问题请先登录注册