新近的实验提示我们,如同一本好书,DNA可以有不止一种解读方法。研究者们不再认为基因在信息和调控方面占有独一无二的至高位置。

50 ~ 60年代,也就是在分子生物学发展的早期日子里,围绕着遗传密码的破译,人们产生了广泛的激动:生命的奥秘终于揭开了!随着对生命现象理解的深入,我们也同时认识到原来我们是多么的无知。分子生物学的前沿研究告诉我们,不能再认为DNA(基因)包容着蛋白质合成的直接的全套指令。从信息的本身番,它们并不比作为交流工具的字符和音符更精确。如同我们熟悉的语言现象,编码在DNA上信息的正确性有赖于强有力的校正机制,也有赖于解读时具体的“上下文”。

传统的观念认为,DNA包容着细胞制造活性蛋白质所需要的全部信息。“遗传密码”将DNA片段(基因)的结构与特定蛋白质的结构联接起来。密码的工作过程如下:DNA上的碱基以三个为单位形成“密码子”,决定一特定的氨基酸;DNA指令着氨基酸如何以线性方式结合,最后形成特定的蛋白质。

DNA还提供着合成下列分子的信息:rRNAs,核糖体的核酸部分;转移RNAs,识别三联体密码子并将氨基酸加入新生的蛋白质链;信使RNAs(mRNAs),将细胞核内DNA的信息转移到细胞质,并指导蛋白质的合成。

在决定基因表达的发育阶段特异性方面,DNA也起着主要作用。蛋白质合成的时序控制对有机体的生长和发育是至关重要的。对这种控制程序作适当调整,有机体便能适应外界条件的变化。这些控制信息也包容在DNA中:基因与特定的DNA序列相连接,这种W定的DNA序列又作为基因表达的开关。这些开关限定着特定的基因转录成mRNA,因此也限定着特定蛋白质的合成。

上面就是关于DNA及其功能被广泛接受的观念。这是个十分有用的模型,据此,人们进行了许多富有成果的实验。这些观念现在已经根深蒂固,其中很多内容都已变成常识。

然而新近的研究指出的“工作”机理及其与细胞内所有其他组分的相互作用过程都远不止如此。这是传统观念无法容纳的,传统观念基本上也还正确,但现在看来却非常局限。它仅描述了一些重要的部分,而不是全部。传统的观念带着固有的概念上的问题。须知,DNA永远也不会成为细胞和机体的完全的和直接的“上帝”。传统观念也并非太错,在需要侧重DNA在所有组分中的位置以及这些组分的相互作用时,传统观念仍然是正确的。

举例来说,核酸并不只是在三联体密码子的水平上与其他分子相互作用。核酸信息也可在其他水平得以解读。这一观点有广泛的论据。分子生物学家早就发现一种称为“回文结构”的双向对称DNA序列,其中两条互补链在从一个方向阅读(如都从5'到3'端)时是完全一样的。这种回文结构通常是控制基因活性的蛋白质的结合位点。限制性内切酶识别特定的核苷酸序列,并在识别位点切断DNA。这些酶为细菌抵御入侵者提供了手段。而且,不同的限制性内切酶具有不同的DNA序列识别和切割位点,因此这些酶显然也是能够“阅读”DNA碱基序列的。

酶与转移RNAs(tRNAs)也能以不同的方式相互作用,tRNAs识别信使RNA上的三联体密码子,并将正确的氨基酸加到延伸中的蛋白质(多肽)链上去,但必须先识别正确的氨基酸,将相应的氨基酸加到相应的tRNA之上。这一过程是由氨基酰化酶完成的,我们现在知道,这种识别过程并不依赖于三联体密码子,而是依赖于tRNA分子其他位置上的一对关键碱基。

其他的相互作用对生物大分子(如蛋白质和核酸)也是重要的。例如,小分子和离子与大分子结合,使其结构稳定,并经常性地激活细胞内的分子反应。许多细菌基因受称为操纵子的DNA序列控制,操纵子反过来又受简单分子,如环化 - 磷酸腺苷(cAMP)的控制。

甚至蛋白质的功能也不只是DNA决定的。蛋白质的一级结构——多肽链中氨基酸的线性序列——仅仅包含着形成功能性蛋白质的一部分信息,其三维形状亦受制于二级结构、三级结构和某些特定结构(包括α - 螺旋,β - 折迭和不规结构)。而且,有些蛋白质(如血红蛋白)由几个蛋白质亚单位构成,形成所谓的“四级”结构。不论是蛋白质的二级、三级或四级结构,都无法直接编码在DNA的序列之中。

让我们作一个语言上的类比:一级结构相当于DNA碱基序列的字面直译,而二级和更高级的结构才使蛋白质成为语法和语义俱通的句子。在DNA与蛋白质的最后构型中不存在一一对应的关系,也不存在DNA的碱基序列直接控制蛋白质高级结构的直接机制。当然,氨基酸序列可以自组装为有三维结构的多肽,因此DNA的结构对三维结构存在某种限定作用,但这种限定不是直接的;通常,从一种一级结构可以推演出不只一种的三维结构,但却只有一种行使正常功能。

保证蛋白质最后处于最合适位置的一种精巧系统发现于蛋白质的跨膜转运之中。这些蛋白质在其一级结构的末端具有特殊的序列,这种序列是DNA序列的字面直译。一旦蛋白质到达它应有的位置,它便失去了这种末端序列;否则,蛋白质就不能处于活性状态。这是个蛋白质在从DNA信息译出之后又经加工的清楚示例,这一过程称为后加工。在这里,细胞如同给某些蛋白同贴上了地址标签,待其抵达目的地后再将标签撕下。虽然地址是直接书写在DNA上的,但后加工过程却与原始信息间无任何直接的牵连。

自立的蛋白质

新近的研究指出,一些称为热休克的蛋白质负责蛋白质的后加工过程。蛋白质在跨膜转运过程中需要改变构象,热休克蛋白质通过与被转运蛋白质的结合就可改变后者的构象、不单如此,热休克蛋白质与具有错误构象的被转运蛋白质结合,还能校正其构象。因此,这种翻译后加工的过程不仅保证了蛋白质到达正确的目的地,使其获得正确的活性构象,还能使其二级、三级和四级结构的错误得到校正、换句话说就是,这些蛋白质使DNA序列字面直译成的氨基酸序列变成了语法和语义俱通的蛋白质语言。

编辑”是后加工的第二个例子。早期的研究者发现,细胞将携带在mRNA中的DNA信息重新剪接起来。在除细菌之外的所有生物,其DNA信息都携带在不连续的外显子上,外显子被没有编码功能的间隔序列、即内含子隔开。外显子和内含子都一并转录成mRNA,但不去掉内含子就无法进行正确的翻译。在翻译之前,要切除内含子,将外显子以正确的次序连接在一起,这一过程称为剪接。既然存在这样的去掉无信息的内含子的编辑机制,是否也还需要有插入漏失信息序列的编辑机制?将来的研究或许会发现这样的现象:核酸序列先以速记的形式写成,在翻译成蛋白质之前再将速记信息改写为正常方式。

这两种后加工过程受DNA的直接控制吗?两种过程都有各种蛋白质、核酸酶和蛋白酶的参与,这些分子的构象都由多肽的氨基酸序列演化而来,而氨基酸序列又是DNA信息字面直译出来的。即使如此,两种过程却都丝毫不受DNA的直接控制。待加工分子的结构控制着分子与加工工具的化学亲合力。这种特异的相互作用构成了后加工过程的唯一控制因素。如果还有其他因素的话,后加工过程也是深深植根于蛋白质的功能调节范畴之内的,这与核酸的直接控制毫不相干。更令人惊异的是,校正过程能弥补丢失的基因段落,锥虫——引起昏睡病的一种血液寄生虫——的一些基因并不含有制造完整蛋白质的所有DNA序列,从这样的基因转录出的mRNA在信息上也是不完整的,但校正过程却能在转录物mRNA上插入丢失的核酸序列。

如果说不再有理由认为核酸独裁着细胞的信息和功能,那么我们又当如何认识呢?另一个模型是将基因组DNA看作处于严格的线性序列和一整团乱麻之间的某种东西。从DNA到蛋白质的翻译过程不依赖于特殊的蛋白质,而依赖于一套简化的一般操作规则的运用。这套规则是这样制订的:从全部信息中过滤出有麻义信息,对其进行重组,然后翻译成蛋白质,过滤过程包括细胞处于不同的时间和生理状态下时,如何对基因组的不同部分进行有选择的阅读。过滤包括了蛋白质语言和核酸语言的相互作用。

这样的系统相当简单,但核酸的信息安排却要频繁地被可移动的遗传因子(如转座子,或跳跃基因和其他因素)打乱。因此系统还应包含良好的检错机制和无意信息的拒纳机制。信息的剪接也要相当精确,以使产生的东西有意义。这种过程不能用刻板的方法控制,我们可以设想一种自动的、自组织的系统。在这个系统中,信息的任何一个片段自身都含有自己的密码,识别自己与同一信息其他片段间的相对位置。

这种自我检索系统在计算机的数据库组织中是司空见惯的(数据库中任一条目下的信息都包含自己的检索号码)。细胞对“乱麻”中的核酸信息片段的识别过程独立于基因组的直接控制。

竞争和平衡

这种观点与现在的遗传图谱仍然是一致的,但基因组中特定位点上的基因却有了不同的意义:它只代表了一些焉为特别的信息单元的位置。而且,除非这些信息单元在其他位置得到重复,其通用片段的突变将引起广泛的、甚至是致死的效应,重复序列某些拷贝的缺失不会使信息的转录和翻译终止,但却可改变支配着这一信息(或其作为一部分的其他信息)的选择和翻译的化学平衡,因此通过其丰度的减少或产生速度的变化就可产生效应。

颇具意味的是,混乱的基因组可能恰恰是基因组及其信息的稳定以及快速进化所需要的,信息片段在基因组中的复制和分散增加了稳定性,这排除了信息片段一次性丢失或损坏的可能性,留下的间隙也能由相似的寡聚核苷酸和校正机制填补。混乱分散了危险,同时也造就了一个“图书馆”其中每本“书”的每一“页”都被分别地、独立地储存起来;但每“页”都有编码,因此,相关的“页码”在需要时就能够以正确的次序抽取出来。同时,这样的安排也为快速进化提供了手段:信息片段在后加工过程和翻译过程中可能会出现新的排列,而这种新的排列是不需要碱基对的突变的。

按照这个方案,细胞的“语法”有微小的变动就足以引起生物体的大的变化。这种变化一旦发生,基因组的DNA信息也就有了很不相同的意义。

换句话说,语法的调整完全可能在基因组DNA发生显著变化之前实现,而不是之后。它们可以提供发生有利于DNA信息变化的条件,因此,遗传和进化的实现就不只是处于信息和调控金字塔顶峰的基因组的一己之事了,DNA与其它细胞组分的相互作用亦发挥着重要的作用。

[ New Scientist,1989年3月]