关于GO注释结果的分析

我在做GO注释时,系统给出了这样一个分析结果。
Cellular Component:
98 (1.2) GO:0005576 extracellular region 胞外区
65 (0.8) GO:0044421 extracellular region part
3895 (47.8) GO:0005623 cell
3895 (47.8) GO:0044464 cell part
1 (0.0) GO:0019012 virion
1 (0.0) GO:0044423 virion part
80 (1.0) GO:0031974 membrane-enclosed lumen
121 (1.5) GO:0031975 envelope
970 (11.9) GO:0032991 macromolecular complex
1611 (19.8) GO:0043226 organelle
666 (8.2) GO:0044422 organelle part
65 (0.8) GO:0044421 extracellular region part
72 (0.9) GO:0044456 synapse part
74 (0.9) GO:0045202 synapse
------------------------------------
Total: 14


Molecular Function:
27 (0.3) GO:0009055 electron carrier activity
446 (5.5) GO:0060089 molecular transducer activity
257 (3.2) GO:0030234 enzyme regulator activity
241 (3.0) GO:0030528 transcription regulator activity
3857 (47.3) GO:0003824 catalytic activity
5282 (64.8) GO:0005488 binding
14 (0.2) GO:0016209 antioxidant activity
1 (0.0) GO:0015457 auxiliary transport protein activity
3 (0.0) GO:0016530 metallochaperone activity
113 (1.4) GO:0045182 translation regulator activity
240 (2.9) GO:0005198 structural molecule activity
2 (0.0) GO:0010860 proteasome regulator activity
700 (8.6) GO:0005215 transporter activity
------------------------------------
Total: 13

我的问题是:
第一列的数字是基因数码?如果是,我的注释结果一共才8千多条unigene,这些数字加起来应该快1万条了,这是为什么呢?
第二列括号里的是百分比吗?像Molecular Function这个大类,为什么加起来之后远超过百分之百了呢?
已邀请:

ybzhao

赞同来自: zmxzx cassavagenomics luck_cc

同一个基因是不是可以被分配好几个go号?我知道做cog分类时,有些基因有多重功能,因而会分配多个cog号。

zmxzx

赞同来自:

谢谢兄台回复,那个百分是怎么算的呢?比如Cellular Component:大类里一共有基因11549条,cell
小类中才3895条基因怎么就占了47.8%啊?本人菜鸟一个,先行谢过!

super_cnn - rna-seq

赞同来自:

这个百分比应该是占你的8000多unigene数的百分比吧

zmxzx

赞同来自:

谢谢楼上答复。
extracellular region
extracellular region part
cell
cell part
virion
virion part
================
再问一下,上面这些两两之间有啥区别啊?细胞和细胞部分具体指的是什么啊?

eric

赞同来自:

大类应该是有三类的,分子功能(Molecular Function),生物过程(biological process)和细胞组成(cellular component)。然后按照每类统计,你可以自己再统计下,具体的方法应该是最简答的加减乘除(I guess)?你可以随便找一个转录组的数据分析,应该就会比较清楚。顺便问下楼主是用什么软件或者程序包做的GO分析?

zmxzx

赞同来自:

我也是这么算的,但还是和系统给出的结果对不上。
我用的是华大的wego程序

super_cnn - rna-seq

赞同来自:

可能的问题应该是数据库版本的问题。

eric

赞同来自:

你要不换个软件试试?虽然我不知道应该换什么会好~

要回复问题请先登录注册