植物学家们正在将要完成对一种有花植物——一种名叫拟南芥菜(Arabidopsis thaliana)的野生芥菜的第一套遗传序列的测序。与此同时,在最后一批A、C、G、T组成的遗传信息被存储人GenBank之前,一组植物学家已经为下一阶段策划了一个雄心勃勃的计划:研究此种植物的所有25000种基因的功能。该计划于2000年6月初公布,得到了美国国家科学基金会(NSF)的赞助,还给芥菜研究界带来了另一个好消息:该计划出人意外地发表了一系列发现这些基因的分子标志。

拥有130百万碱基对的芥菜基因组将在2000年7月份完成测序并于年底发表,比原计划提前3年。卡内基研究所的植物学家克里斯·索莫威尔(Chris Somerville)说,在解读这种与实验室小鼠同等大小的简单植物过程中逐渐积累下来的信息已经给研究工作带来了“一种量的改变”,使得分离基因的时间从几年缩短到几个星期,并因而加速了从更加有益于健康的大豆油到可能导致农作物更快生长的某种蛋白质的遗传学发现。

芥菜专家们并不满足于他们已有的成就,他们现在想要去研究由每个单个的基因所表达的那些蛋白质、细胞内每种蛋白质的功用和它们的生物化学,这一任务可能要花费10年时间和5亿美元。这项称为“2010计划”的计划是在加利福尼亚州拉·乔拉的索尔克生物学研究所一月份的一次研讨会上提出来的,最近在因特网上发表,网址是www. arabidopsis. org / workshop1. html,还在本月(2000年6月)的《植物生理学》杂志上发表了其摘要。提议者说,这项多国参与合作的计划将有助于许多问题的研究一从基因表达在各种物种中是如何受到环境的影响的,到构成一种植物所需要的基因的最小数目。

该研究小组的最终目标是在因特网上创建一种“虚拟植物”,在这种“虚拟植物”网页上,科学家可以点击一个从种子到落果成熟期、处于各种发育阶段的芥菜细胞,看到每个表达的蛋白质及它们之间的联系。但是,该计划的作者之一、费城宾夕法尼亚大学的乔·埃克(Joe Ecker)告诫说,2010计划仅能完成这一任务的一半;就现在而言,他们将静下心来去了解所有这些蛋白质各自的功能。

这本身就是一件巨大的工程。2010计划将首先资助那些提供必要的研究工具,如研究基因表达的DNA芯片、克隆各种基因的文库和基因剔除的株系等的“基因组技术中心”。这项计划很可能吸引那些早已集中在一起,对美丽隐杆线虫、果蝇和人类进行高通量功能基因组学研究的实验室英才们。为了给该计划提供有力的支持,美国科学基金会将为2010计划在2001财政年度提供2500万美元的资助,埃克希望这个数字能够提高或者得到其他机构的追加补充。

上个星期,法玛西亚公司(Pharmacia Corp.)下属的赛利昂基因组学公司(Cereon Genomics LLC)公开发布了39000个单核苷酸多态性(SNPs),这是一种很受基因狩猎者们欢迎的新工具(其网址是www. arabidopsis. org/cereon/index. html)。到目前为止,可以从公开途径得到的关于芥菜的SNPs仅有400个。俄克拉荷马州立大学的一位芥菜研究者大卫·梅因克尔(David Meinke)说:“如果你考虑其基因组大小的话,这是一个很大的数目。”足以分离差不多所有的基因。另外,索莫威尔还说,赛利昂公司正在事实上毫无“附加条件”地公开这些SNPs,学术界和非赢利用户都可以自由地对这些SNPs得出的发现申请专利。有了这些SNPs和2010计划这个重大的正在进行中的功能基因组学计划,芥菜研究者们显然正在不断地取得进展。

[Science,2000年6月9日]