“功能基因组学”是一个已扎根于科学界的术语。当人们提到功能基因组学的时候,先要明确其确切的意思。在有关人员中进行的一项非正式的调查显示,这一名词已被广泛使用,但是有着许多不同的解释。甚至有的观点认为这一术语并无必要,而且仅仅是泛指生物学研究。浏览过去12个月中冒出来的几百个网址,可以清楚地看出对这一术语的解释是多种多样的,突出显示了“轰动性广告”的效应。它被用来促进功能基因组学的研究,同时却很少提供资料来支持。但是,功能基因组学概念的提出,促使人们在全基因组结构知识的背景下,产生种种新的想法和研究方法以理解其生物学机制。

要完全理解功能基因组学,我们必须先追溯一下它的起源。“基因组”这个术语本身早在75年前就提出来了,它指的是一个有机体的全套基因和染色体。“基因组学”一词是在10年前(1986)由托马斯 · 罗德里克(Thomas Roderick)首创的,用来描述有关基因组的作图、测序和分析这一学科领域,也是为一份新的期刊“基因组学”命名。该词在过去10年HI已被普遍接受。但是,基因组学现在正经历着从基因组的作图和测序(人类基因组计划最初表述的目标)到对基因组功能的强调这一转变和扩展。为了反映这一转变,基因组分析现在似可分为“结构基因组学”和“功能基因组学”。结构基因组学代表基因组分析的早期阶段,有一个清楚的终点——构建生物体高分辨率的遗传图、物理图和转录图。生物体的最终物理图谱就是它的全基因序列。

功能基因组学代表基因组分析的一个新的阶段,开发各种能够利用结构基因组学的丰富信息的新技术需要创造性思维,功能基因组学为之提供一个坚实的基础,而且它本身也将需要创造性思维。特别是,功能基因组学涉及到全面的(基因组范围的与系统范围的)实验方法的发展和应用,这些实验方法是通过利用结构基因组学提供的信息和试剂,来评估基因的功能。高产量和对结果进行统计学分析与计算机分析结合的大规模的实验方法论是它的特性。功能基因组学研究的基本策略是拓展生物学研究的范围,从单个基因或蛋白质的研究转变到对所有基因或蛋白质以系统化方式进行及时研究。在这一领域,计算机生物学将扮演关键性的和开拓性的角色。结构基因组学以资料的处理为特征,而功能基因组学将以某一有特殊价值的信息为特征。功能基因组学为快速缩小序列和功能之间的差距、获得生物系统行为的最新知识提供保证。

最近有几项功能基因组学方面研究的新成果。酿酒酵母(Saccharomyces cerevisiae)的基因组测序最近已经完成(换句话说,结构基因组学阶段已经结束),这为开发功能基因组学研究的潜在价值提供了原材料。一个由酵母生物学家组成的国际联合会正在系统构建一整套酵母菌株,其中每一株都将缺失总数约为6000个基因中的一个基因。通过聚合酶链反应(PCR)或DNA微卫星点阵的研究,使某些酵母的开放阅读框被寡核苷酸“小棒密码”所替代,从而揭示这些菌株何以能在特殊条件下生存的原因。有关资料一旦完成收集工作,就可以公开发表,这将给那些专门从事特殊细胞学或基因群研究的酵母菌实验人员以机会,利用这套菌株来设计实验方案或进行遗传学筛选。为获取基因组范围的mRNA表达数据,新设计了3种方法,寡核苷酸“芯片”、SAGE与DNA微卫星点阵。这在了解全基因组序列(包含全部基因)的时候显得特别有用。德 · 里斯等人发表在科学(Science)278期上的报告举出了这方面的一个很好的例子。与生理性的改变或人工操纵调节基因所致表达谱的变化相比,DNA微卫星点阵方法能提供一个更为全面的新景象。在知道几乎全部的表达序列标签(EST)的情况下,SAGE方法已经被正确应用到对人癌症基因差异性表达的分析当中。

另外,酵母菌基因组序列的知识使得用双杂交法对全部6000种酵母蛋白质进行蛋白-蛋白相互作用的分析变得可行。总共1800万种组合的分析工作正在进行之中。在知道全基因组序列的情况下,通过高分辨率的双向胶和电喷质谱技术从蛋白质复合体中分离出得到的蛋白质部分序列可以使肽段精确对应到相应的基因序列上。

正如彼德 · 古德非洛所言,功能基因组学的中心论点是许多生物(包括人类)的基因组的全部序列将改变我们研究生物学的方式。哈佛医学院院长丹尼尔 · 托斯特森更清晰地描述这种情形:“过去我们由功能寻找序列;将来,病理学与生理学将成为序列的‘功能的执行者’”。当基因组水平上的观点开始成为研究课题的时候,传统学科已经在采纳丁,一个例子就是癌症基因组解剖计划(CCAP),将给癌症检测、诊断、预后和治疗提供基本原理和新的方法论。功能基因组学不仅使传统的研究手段更富有效率,而且,它将用生物系统机能整体性上的诱人前景补充由传统研究方法对基因功能的详尽理解。但是,在搞清生物机制的过程中,功能基因组学不会取代遗传学、生物化学、细胞生物学和结构性研究。功能基因组学能在多大程度上阐述蛋白质(或蛋白质组)的功能,将随着所采用的方法和基因而有不同。总的说来,已知的功能信息将会给进一步的分析提供框架和起点,就好比初步的遗传学筛选找到候选基因,而这基因还需要下一步的详细求证。

我们正在进入一个能更多看到功能基因组学数据同时更少听到轰动广告的时期。尽管实验得到的数据真空前庞大,有效的可重复的方案应该是通行口令,这样新产生的技术才能得到正确的评价。科学出版物的传统样式不能反映已有数据的广度和深度,出版物中的结果和结论的汇编当然是有意思的,但是对于别人进一步分析和利用这些数据不是很有用,可能还不够同时进行有效综述。关于如何利用这些由公共资金资助的基因组水平上的功能分析数据,应该出一期专刊。结构基因组学时期的宝贵财产是数据公开的宗旨与实践,我们希望这一财产能传到功能基因组学时期比如,以独立于专门技术之外的某种标准格式及时发布表达数据,将使这些结果得到最有效的分析和利用。

[Science,1997年10月24日]