基于RNAseq技术的肝细胞肝癌转录组学研究(18)
时间:2025-04-08
时间:2025-04-08
基因的不同剪接模式(通常情况下,EST很难确定一个新的序列是由于选
择性剪切产生的还是由于cDNA文库中污染的基因组DNA序列[28])。在真
核生物中,尽管基因组的非编码区序列远远多于编码序列(97% vs. 3%),然
而编码序列却携带着绝大部分的遗传信息[29],因此EST对于寻找新基因
具有非常重要的意义。
真核生物典型的mRNA分子由5’-UTR(5’端转录非翻译区)、ORF(开放
阅读框架)、3'-UTR(3’端转录非翻译区)和poly(A)四部分组成,其反转录
cDNA具有相对应的结构[30]。对于任何一个基因,其5'-UTR和3’-UTR都
是特定的,即每条cDNA的5’端或3’端的有限序列可特异性地代表生物体
某种组织在特定的时空条件下的一个表达基因。因此,来自某一组织的足
够数量的ESTs可代表某种组织中基因的表达情况[31]。一个基因的拷贝数
越多,其表达越丰富,能够测得的相应EST就越多,因此EST的数目可以
反映某个基因的表达情况。所以,通过对生物体EST的分析可以获得生物
体内基因的表达情况和表达丰度。
首先提取细胞的总mRNA,然后构建获得cDNA文库,挑选出长度为
300-500bp的序列片段(即EST序列)进行序列测定,最后结合生物信息学
方法推算出EST所代表的全长基因序列。通常情况下,EST序列位于其对应
的一段cDNA的3’或5’端非编码区,也可以在该cDNA文库中随机选取[32]。
EST主要步骤:将mRNA反转录为cDNA并克隆到载体构建成cDNA
,,文库;随机挑选cDNA克隆;碱裂解法或PCR扩增法制备模板;对5或3
末端进行序列分析;与同种或异种生物核酸和蛋白质数据库中已知的序列
进行比对分析;新基因及未知基因的分析及GenBank注册。目前,EST已
经被广泛的应用于分子标记、新基因发现及鉴定、基因表达谱分析、基因
组功能注释、基因识别等研究领域。因为ESTs的数目比GenBank中其它
的核苷酸序列多,因此更容易在EST库中搜寻到新的基因[32, 33]。
为了能快速分析大量的cDNA克隆,优化测序结果,构建cDNA时,
必须进行消减杂交(subtractive hybridization)来尽量消除冗余的无信息克隆。
下一篇:网络信息检索的现状及发展趋势