基于RNAseq技术的肝细胞肝癌转录组学研究(18)

发布时间:2021-06-06

基因的不同剪接模式(通常情况下,EST很难确定一个新的序列是由于选

择性剪切产生的还是由于cDNA文库中污染的基因组DNA序列[28])。在真

核生物中,尽管基因组的非编码区序列远远多于编码序列(97% vs. 3%),然

而编码序列却携带着绝大部分的遗传信息[29],因此EST对于寻找新基因

具有非常重要的意义。

真核生物典型的mRNA分子由5’-UTR(5’端转录非翻译区)、ORF(开放

阅读框架)、3'-UTR(3’端转录非翻译区)和poly(A)四部分组成,其反转录

cDNA具有相对应的结构[30]。对于任何一个基因,其5'-UTR和3’-UTR都

是特定的,即每条cDNA的5’端或3’端的有限序列可特异性地代表生物体

某种组织在特定的时空条件下的一个表达基因。因此,来自某一组织的足

够数量的ESTs可代表某种组织中基因的表达情况[31]。一个基因的拷贝数

越多,其表达越丰富,能够测得的相应EST就越多,因此EST的数目可以

反映某个基因的表达情况。所以,通过对生物体EST的分析可以获得生物

体内基因的表达情况和表达丰度。

首先提取细胞的总mRNA,然后构建获得cDNA文库,挑选出长度为

300-500bp的序列片段(即EST序列)进行序列测定,最后结合生物信息学

方法推算出EST所代表的全长基因序列。通常情况下,EST序列位于其对应

的一段cDNA的3’或5’端非编码区,也可以在该cDNA文库中随机选取[32]。

EST主要步骤:将mRNA反转录为cDNA并克隆到载体构建成cDNA

,,文库;随机挑选cDNA克隆;碱裂解法或PCR扩增法制备模板;对5或3

末端进行序列分析;与同种或异种生物核酸和蛋白质数据库中已知的序列

进行比对分析;新基因及未知基因的分析及GenBank注册。目前,EST已

经被广泛的应用于分子标记、新基因发现及鉴定、基因表达谱分析、基因

组功能注释、基因识别等研究领域。因为ESTs的数目比GenBank中其它

的核苷酸序列多,因此更容易在EST库中搜寻到新的基因[32, 33]。

为了能快速分析大量的cDNA克隆,优化测序结果,构建cDNA时,

必须进行消减杂交(subtractive hybridization)来尽量消除冗余的无信息克隆。

精彩图片

热门精选

大家正在看