mRNA前体的剪接反应涉及一种异常的RNA结构:一种套环状或尾环状分子,其中插入序列的5'端同链内某一核苷酸之间借2'—5'磷酸二酯键连接在一起。本文对套环状结构的形成及其可能的意义进行了讨论。

发现真核生物DNA病毒基因存在插入序列的剪接现象已过七年了。自那时以后,发现含有内含子(Intron)的基因的种类日益增多,包括高等生物中绝大多数编码蛋白的基因、许多tRNA基因、线粒体基因、叶绿体基因和某些rRNA基因。不管这些基因的来源和可能的功能如何,它们所含的内含子都必须通过剪接反应从RNA前体中切掉。主要由于发展了一些经得起生化技术检验的体外转录系统,所以,已知道了tRNA剪接和一种rRNA剪接的机理。但是,直到最近关于核内mRNA前体的剪接过程,即使最简单的轮廓也是模糊不清的。在缺乏来自体外系统的生化数据的情况下,为了研究mRNA前体的剪接反应已经采用了数种手段:构建杂合型基因、对内含子部分序列进行缺失或重排,或者对潜在的剪接信号点进行突变。这些研究表明,靠近内含子两端的序列含有为产生准确的剪接反应所需的大部信息。

4.3.1

在可溶性抽提物中进行的剪接反应

这些体外研究目前还不能回答有关mRNA剪接反应的几个关键性的问题,例如:是什么物质负责特异地选择一个内含子两端剪接点内侧的序列?怎样把内含子切掉然后把两旁的外显子连接在一起?结合在核内Pre-mRNA上的那些蛋白质在加工mRNA的过程中起着什么样的作用?RNA从核到细胞质的运输过程同RNA前体的加工过程是怎样偶联进行的?随着可以忠实地剪接mRNA前体的无细胞系统的发展,今后有可能回答上述问题。作者在本文中介绍了一些来自体外系统研究剪接反应获得的结果,并且讨论了这些结果的意义。

用于在哺乳细胞抽提物中剪接mRNA前体所需的底物,是一种简单的RNA分子,它的两个外显子(Extron)被一个具有完整5'和3'剪接点的插入序列所隔开,某些系统需要5'端帽子结构,而3'端Poly(A)尾巴则可有可无。除了细胞抽提物之外,还需要其他成分如ATP、Mg2+和一价阳离子。在这种体外系统中进行的反应具有一种奇怪的特点:在可以检测出微量的已被剪接的RNA之前存在15 ~ 30分钟的延滞期,之后才线性地生成已被剪接好的RNA。在这延滞期中发生的事件需要ATP。很可能,RNA前体在延滞期中被装配成一种多成分的复合物,后者才能正式参加剪接反应。核内含UI RNA的小核糖核蛋白颗粒(UI RNP)很可能是这种复合物中的一种成分。已经发现在UI RNA 5'端和3'点剪接点发现的“一致序列”之间存在着明显的序列互补关系,因而提出在剪接反应中重要的一步是5'剪接点同UI sn RNA之间互补结合在一起,这种假说受到如下发现的支持:提纯了的UI sn RNP能够结合在RNA5,剪接点从而保护后者免遭核酸酶的消化;加入抗UI sn RNP的抗血清将会抑制体外剪接反应;用酶法除去UI RNA的5'末端序列将会阻止剪接反应的发生。

剪接反应中的RNA中间体和RNA产物

经过延滞期以后,前体HNA中首先可以被检测到的化学变化是发生在5'剪接点的切开反应,结果产生了代3' OH末端的5'外显子以及含有“全部插入序列 - 3'端外显子”的RNA中间体。这一RNA中间体具有两个奇怪的特点:它形成了一种套环或尾环,插入序列的5'端共价连接到靠近其3'端某一核苷酸上;它含有一种异常的核苷酸结构:由两条RNA链同时借2'-5'和3'-5'两种磷酸二酯键与同一个腺苷酸连接从而产生RNA分枝结构。5'剪接点的磷酸基团保留在与A2' OH形成的2'-5'磷酸二酯键中,不明白5'剪接点的切开反应和插入序列的5'端在分枝点形成2'-5'磷酸二酯键的成键反应二者是否是偶联进行的,即腺苷酸2' OH是否参加5'剪接点以转酯反应。或者反应要分几步进行。不过已明白的是:由于在该反应以及下面要谈到的反应中磷酸二酯键的总数没有变化,因而这些反应不需要外加能量就能自动进行。

下一步反应或一系列反应生成了拼接好的外显子和一个游离的插入序列,这游离的插入序列仍然保持套环状,只不过由于丢失了3'外显子而拖了一条更短的尾巴罢了。被切出的插入序列3'端含有一个OH基团,因为在3'剪接垮的磷酸基团保留到已拼接的RNA新形成的3'-5'磷酸二酯键中去了,如同上述第一步反应一样,在3'剪接点的切开反应和“5'外显子 - 3'外显子”连接反应也可能是一步偶联的转酯反应或者包括了一系列各自孤立的反应。再次,由于产物和反应物具有相同数目的磷酸二酯键,因而从理论上讲不需要能量辅助因子即可进行反应。但如前节所述,ATP是剪接反应中重要的辅助因子。无论ATP的非水解α-β类似物或β-γ甲叉类似物在反应中都不是活化的。目前还难以分辨:这种情况抑或是反映了为装配核糖蛋白的复合物结构所需ATP参加的过程,抑或是反映了用于切开和连接磷酸二酯键需要ATP参加的过程。

分枝点的定位

还不清楚哺乳类基因中内含子内部序列特异性的意义以及分枝点的位置。已有两个例子知道分枝点分别位于3'剪接点上游的24号和36号核苷酸处。根据不同物种球蛋白基因之间存在的序列同源性,已经提出分枝点位于3'剪接点上游18号到40号核苷酸之间。对酵母基因的内含子进行缺失突变的体内研究,证明在内含子的内部存在一段对剪接反应非常重要的高度保守序列UACUAAC。这段序列位于3'剪接点上游20号到60号核苷酸之间,最靠近3'端的腺苷酸正好是形成分枝点的地方。对酵母这段特异序列进行点突变,将会抑制剪接反应,虽然高等真核生物中的分枝点显然应与酵母分枝点序列密切相关,但前者的序列并非是高度保守的,对许多哺乳类内含子寻找与酵母分枝点类似的序列,结果仅找到一段很不完整的一致序列(CToAAoT)。在哺乳类基因正常分枝点进行缺失突变后,它们在体内实验的条件下仍能正常发生剪接反应,不过很难判断这种体内剪接反应的精确性,因为即使不改变细胞质mRNA稳态浓度的情况下体内剪接速度仍有100 ~ 1000倍的波动。但是有一点是要弄明白的,在这些突变基因中,要么剪接反应根本不需要形成分枝结构,要么在3'剪接点附近产生缺失的序列又可以作为另一种分枝结构。

在腺病毒基因和人β球蛋白基因第一个插入序列中,含有分枝点的序列同它们相应的5'剪接点的一致序列之间表现出明显的互补性。在一种情况中有10个连续的碱基对之间是互补的(G:U对也计算在内),在另一种情况中连续10个碱基对中有9对碱基是互补的。对于酵母内含子,也观察到其分枝点保守序列UACUAAC同其5'剪接点保守序列之间存在互补关系。看来这种互补关系对于特一化分枝点的位置和剪接反应的速度都是很重要的。如果5'剪接点同分枝点在形成分枝的过程中要相互配对的话,则有3 ~ 5个核苷酸仍然不得不保持单链而呈突环结构。这里我们看到了一件有趣的或许是幸运的情况:5'剪接点一段序列既同UI RNA 5'端序列互补也同分枝点序列互补。首先需要UI RNP识别并结合在5'剪接点序列上以便装配成剪接反应所需要的核糖核蛋白结构。然后,5'剪接点序列又必须与UI RNP分开,以便去同分枝点序列互补结合。暂且不说这种假说,我们将要对5'剪接点和分枝点进行碱基缺失突变,然后观察缺失突变对剪接反应速度的效应,就可看到5'剪接点和分枝点二者序列互补关系在剪接反应中扮演的角色了。

RNA分枝点的功能

有点令人奇怪的是,RNA分枝结构(在同一个核糖组分的2'位和3'位同时形成2'-5'和3'-5'磷酸二酯键)在自然界是罕见的。合成核苷酸的化学家长期以来就为核苷酸2'OH的反应性感到烦恼。实际上,在分子生物学的早期就有人思索过分枝RNA的存在。瓦拉斯(Wallace)和依梦茨(Edmonds)在进行Hela细胞核内Poly(A)+RNA放射性标记分析时首先探测到RNA分枝结构。瓦拉斯和依梦茨在他们所用的标记方法的情况下,检测到核内Poly(A)+RNA中每40,000个核苷酸存在一个分枝结构,细胞质Poly(A)+RNA中每106核苷酸存在一个分枝结构。如此少数的分枝结构说明分枝结构在体内的情况下迅速遭到分解、因而不是稳定RNA的正常成分。也可能在别的细胞学条件下,分枝结构被用于形成RNA网状系统或者作为RNA功能或RNA代谢过程中一种重要的信号。

还不清楚分枝结构在mRNA剪接反应中的功能。在体内的情况下,插入序列被切掉后迅即降解,而反应的其他产物(被拼接好的外显子)则是稳定的。虽然这两种RNA在很多方面不同,但在切掉的插入序列中存在的分枝结构可作为降解途径的信号,那么在体外情况下观察到已被切的插入序列的稳定性,或者可以解释为体外系统不能将已被切掉的插入序列从保护它们的复合物中释放出来。同样可能,在剪接反应中分枝结构的形成是整个过程不可分割的一步。例如,插入序列5'端共价连接到分枝点A2'OH这一步反应就是非常重要的,它可除去第一次切开反应产生的5'外显子,从而强迫反应继续进行。

双价RNA中间体

剪接反应机理最吸引人的特征之一是双份中间体,它含有5'外显子和“插入序列 - 3'外显子”套环状RNA,在体内反应中也是稳定的。分析酵母核RNA时已经检测到了相应的RNA中间体。因此,体内剪接反应也可以采用先形成中间体的方式,许多中间体RNA片段随后再连接成最终的产物。这种过程在体内和体外都能有效地发生,由此我们得到了启示,这些RNA中间体是被一种复杂的RNP结构并列固定着的。目前还弄不清这种RNP复合物的组成;但是核RNP一直被人们广泛地研究着。不难设想剪接反应的底物是同下面两类蛋白复合在一起的:一是小的核内核糖核蛋白(UI RNP),一是真核细胞内总是同核RNA缔合在一起的碱性核蛋白群体。分析剪接反应的一个重要意义是将来可以为这些早就广泛被研究的蛋白提供新的生化功能。

产生双份中间体的剪接反应机理使得可能发生“反式剪接反应”,即被拼接好的数段外显子可能来自不同的mRNA前体。如果一个剪接反应复合物含有两类亚单位,一类亚单位同5'外显子RNA缔合,另一类亚单位同“插入序列 - 3'外显子RNA”中间体缔合,在两个如此剪接反应物中,如相应亚单位之间发生交换,就会发生反式剪接反应。或者换一种方式,一个仅含5'外显子的RNA片段可以变成活化状态,即它先缔合在一个剪接复合物上,然后再在剪接点被切开。这个游离的5'外显子再同别的剪接中间体中的5'外显子相互交换。对于上述想法,最近研究锥体虫mRNA的结果是非常有趣的。在锥体虫中编码各种不同多肽的一大群mRNA,在它们的5'末端部有一段长35核苷酸的共同序列。带这段5'端共同序列的一群小分子RNA(仅长141核苷酸)是从同一基因组的一个区域或几个不同区域转录下来的。因而建议,这一群小分子RNA可能作为从基因组不同区域转录的RNA发生“反式剪接反应”的底物。如果今后证明确实如此,它将给剪接反应的机理增加一个新的和令人兴奋的领域。至少,这与我们观察到两部分RNA剪接中间体在体内和在体外的稳定性是一致的。

酵母中的套环状RNA

迄今为止,观察到套环状RNA是RNA剪接反的产物,还仅限于mRNA前体的剪接反应。这种剪接过程从酵母进化到哺乳动物的历程中都是保守不变的,事实上在这两种生物中5'剪接点、3'剪接点和分枝点都保留着非常保守的同源序列,只不过分枝点的形成方式彼此不同罢了。许多品系的酵母和其他真菌中的线粒体基因含有多种类型的内含子,可分为两大类。种类Ⅰ线粒体的内含子含有一套属于像四膜虫(Tetrahymena)那样把大rRNA插入序列进行“自我对接”的“一致序列”。种类Ⅱ线粒体内含子既不含这类可供“自我剪接”的一致序列,也不含核mRNA前体剪接点那样的一致序列,这两类酵母线粒体内含子的剪接反应皆依赖于成熟酶多肽的活性。成熟酶是以“开放式读框”转译而成的多肽,它从5'外显子转译到线粒体基因Ⅰ和Ⅱ的插入序列中。已经分离到酵母的“无意义突变株”,其线粒体内含子含有可以终止成熟酶多肽的合成和阻止一个或多个内含子的剪接反应。最新的证据表明某些酵母线粒体的插入序列也呈套环状RNA的形式被切掉。因此,线粒体插入序列也具有与核mRNA前体相似的特点。也许,酵母线粒子具有一组各自独立的核途径。在这方面,已鉴定数种核的和线粒体的突变种,是线粒体内含子剪接反应的缺陷型。今后分析这些突变种的表现型和剪接线粒体内含子所需的“顺式 - 作用”序列,将有助于阐明核内剪接反应的机理。

(Trends in Biochemical Science,1985年4月)