基于RNAseq技术的肝细胞肝癌转录组学研究(20)

发布时间:2021-06-06

基于相似性的聚类方法,容易产生假阴性聚类即属于同一基因的序列而未

能聚为一类,通常借助长度更长的mRNA序列进行修正。由于相似基因、

嵌合基因和嵌套基因的存在容易产生假阳性聚类即将不属于同一基因的序

列聚在一类,可以利用基因组信息筛查出这些可疑的错误序列[37]。从转录

组研究角度而言,EST数据只有通过装配过程才能获得真正有意义的转录

组序列。EST的装配包括以下几种方法:以传统基因组序列装配方法进行

的EST装配、基于图论的EST装配、利用参考基因组信息的EST装配。装

配完毕的EST数据,就可以用于后续的转录组分析。

基于EST的转录组学研究可以进行以下分析:Unigene开放阅读框的

预测、基因的差异表达分析、选择性剪接研究[37]、基因注释和功能分类。

基因的注释和功能分类又包括NCBI数据库的NT(无冗余的核酸数据库)

和NR(无冗余的蛋白质数据库)同源比对、SwissProt同源比对、KEGG

注释、COG注释(Clusters of Orthologous Groups of proteins)、Interpro注释

(关于蛋白质家族、功能保守区及功能位点的数据库)、GO(Gene Ontology)

注释等。基于UniGene数据库的EST转录组分析流程可简要概括为Figure 1。

Figure 1. EST分析流程

精彩图片

热门精选

大家正在看