于1990年正式启动的国际人类基因组计划在历时10年后,即将迈出关键一步。预计在本月份,人类基因组计划将完成一张“工作草图"的绘制。这一阶段性成果意味着什么?国际科学界对人类基因组计划下一阶段的任务有哪些考虑?请参阅本栏目的两篇文章——编者

人类基因组的测序工作现在已进入最后的冲刺阶段,测序方法和目的正受到来自私人企业的挑战。

美国国家人类基因组研究所(NHCRI) 所长弗兰西斯 · 科林斯(Francis Collins) (见上图)对此非常着急。作为公立研究机构负责人类基因组30亿个碱基测序工作的领导人,他正协助筹划、实施这项迄今为止生物界最具魄力、可望实现的计划。同时科林斯正面临着来自以克雷格 · 温特(Craig Venter)领导的由私人资助的研究小组的巨大挑战。温特是塞莱拉基因组公司的董事长,塞莱拉公司位于马里兰州的洛科维尔市。这两支队伍针对如何在今后几个月内完成全部人类基因组的工作草图正进行着激烈的竞争。

就在几周前,期望两支竞争队伍之间的合作被搁浅,他们相互指责对方背信弃义。争论的焦点是公布数据的条件,公立机构方面的领导人坚信应当将研究结果立即、无条件地公布出去;而塞莱拉公司则要求那些使用该公司研究的数据者无权与别人共享塞莱拉公司的研究成果。3月14日,美国总统克林顿与英国首相布莱尔一致同意将人类基因组的研究成果立即公布,从而使分歧进一步加剧; 而两位元首的联合声明导致包括塞莱拉在内的生物技术类股票暴跌。

对基因组计划的争论一直没有停止过。7年前在科林斯博士主管这项事务时,曾有许多科学家对人类基因组计划是否太急功近利而争执不休。他们认为,给公众承诺到2005年可以完成整个人类基因组的测序工作是非常愚蠢的。生物学家们曾对进入这一“大科学”领域悲观不已;而今天看来这种担心似乎是很遥远的事了。

1995年,NHCRI 开始加速这一研究进程,重点资助6个承担测序工作最大的单位。转折点发生在1998年,圣 · 路易斯的华盛顿大学罗伯特-沃特顿,由NHCRI资助与由Wellcome Trust资助的英国剑桥桑格中心(Sanger Center)的约翰 · 休尔顿(John Sulton)合作,声称:他们已破译了美丽线虫的整个基因组(9700万个碱基)。

温特博士现供职于“基因组研究所",该所位于马里兰州的洛克维尔市,是一个非盈利性的科研机构。温特博士对用于基因测序的“全基因组鸟枪”方法作了进一步的改进。1995年他以无以匹敌的速度完成了流感嗜血杆菌基因组(180 万个碱基对)的全部测序工作而赢得了科学界的广泛赞誉。1998年5月,温特的惊人之举是:由康州的瑙沃克市的E公;司资助,组建了塞莱拉公司,并声称到2001年应用全基因组鸟枪技术就可以完成人类基因组的全部测序工作。科林斯与其他人类基因组计划(HCP) 委员会的成员为此也做出了相应的反应,即加快基因组的研究进程。1998年9月,他们宣称:他们到2001年就可以拿出覆盖人整个基因组90%序列的工作草图,而该图的碱基的错误率只有百分之一。公立的人类基因组研究组织许诺到2003年将完成99. 99%的人类基因组序列。

今年3月14日,科林斯在美国国立卫生研究院(NIH)的办公室里接受了《科学》周刊的专访,就有关基因组的争论、与塞莱拉公司竞争以及未来HCP的研究重点谈了自己的看法。下面是根据访谈内容编辑、整理而成。

问:你们是否能按时完成人类基因组的草图?你们目标的完整性和准确度是否有变化?

答;我们仍按原计划进行,预计今年春天将实现这一目标。实际上,我们已完成了20亿个碱基对的测序工作,约占整个基因组的70%。完成第一个10亿个碱基对的测序花了4年的时间,而完成第二个10亿个碱基对只用了4个月;我们现在每月以10%的基因组的速度向基因库(GenBank)里添加新的序列。从首次宣称人类基因组计划工作草图覆盖人类基因组常染色体(有意义的)区域90%的序列时起,这一目标始终未变。

问:最近,塞莱拉公司与伯克利果蝇基因组计划( Berkeley Droeophila Genome Project)联合发表了果蝇的基因序列,对此你有何感想?

答:这是一项非常出色的工作,同时也为我们提供了一次非常难得的机会,使我们可以着眼于对果蝇有一个更为全面的认识,毕竟它已经困扰了遗传学家100多年。其基因组的缺口填补工作还要花一年的时间,但毫无疑同这对整个生物界而言价值非凡。

问:这能证明塞莱拉的“整个基因组鸟枪”策略的作用吗?

答:该研究论文告诉我们,至少对常染色体只有120兆碱基对的果蝇而言,整个基因组鸟枪测序法确实如此,但并非是完美无缺的。有些地方确实并不能装配基因组序列:大约存在1000多个缺口。尽管该技术还有许多地方需要加以完善,以便对较大基因组的测序更加实用,但该技术的原理证明是绝对正确的。

问:塞莱拉与人类基因组计划之间的竞争是否已超越了正常竞争的范围?

答:许多争议的焦点都集中在如何获得基因组数据:在公立和私立单位的研究人员是否可以不加任何限制地、自由地获得人类基因组的序列?遗憾的是,新闻界对那些基本争论所给予的关注非常少;相反,却将过多地对人性和竞争进行了报道。

问:公司是否向国会或政府部门抱怨你们将数据公布出去?

上图右一为美国塞莱拄基因组公司董事长雷格·温特

答:我们无法对此类抱怨追根溯源,但是许多公司多次向NHGRI、国会和政府部门强烈地表示:支持把人类基因组计划的研究成果及时公布出去这一政策,国会也非常支持HCP处置人类基因组研究成果这一决策。两周前,即3月8日举行的NH听证会上,国会议员约翰 · 波特和戴维 · 欧倍所发表的陈述即是明证。正如克林顿与布莱尔的声明所言,政府对HGP的支持及对其公布研究数据的立场均是相当理智的。

问:你和其他人员在今年2月写信给塞莱拉公司说,未经公立人类基因组研究机构科学家们的同意不得公开发表人类基因组的数据是不人道的。为什么?

答:从伦理学角度看,我认为测序中心应该有权为自己辩解,并有对该工作进行专题评述的优先权。例如,事实上,果蝇基因组测序工作不是哪个人自己独立完成的,任何人都不可能弄清数据库里的全部信息,发表关于整个基因组序列的论文,这已超出了伦理学所涉及的范畴。

另一宗旨是,如果你发表一篇论文, 通常意味着你已经观测到原始数据,并有足够的理由证明它们。测序的原始数据只不过为了寻找基因提供了一些线索,面本身并不能作为真正的基因序列进入基因库(我们根本就不知道将这些原始数据放在何处)。故此,如果你试图从公共基因数据库中下载了大量尚未发表的数据,并想公开发表,那么你就是在践踏这一宗旨。

问:克林顿-布莱尔发表的关于公布基因组数据的联合声明将伤害哪些生物工程投资商,你对此有何感想?

答:回首往事,许多分析家们一致认为商界对克林顿——布莱尔联合声明作出的反应,没必要大惊小怪。对基因组的这些基本数据而言,联合声明反而促进了数据的及早公布,使人们可以不受限制地得到所要的基因序列。其中谈到:“我 们把所有的基因序列都输到公立的基因库中,这样即便这些专利还没有申请,再申请也没有什么用途。”我们已经申请注册了足够多的专利。现在专利与商标局(PTO) 里还有数以千计的专利申请等待审批。如果涉及大量基因的专利被独家占有的话,这将对基因组学的未来是极为不利的。

问:你说你支持责任性专利。什么是责任性专利?

答:我认为专利局对专利高标准的使用表现出足够的信任。几年前,由于基因可以作为探针,所以曾认为任何DNA序列都是有用的。PT0说按现在标准还不足以说明其有用性。

专利局只接受很少的“第一代”专利,因为这些专利只是一个序列,而并没有说明是什么基因。PTO打算拒绝它们。专利局打算接受大量“第二代”专利的申请,即具有某一序列、并且其同源性具有某种功能。NTH 仔细审查了这些申请,并认为还存在不足之处。现在PTO更倾向于接受“第三代”专利的申请,我想大多数人也认为“第三代”更适合专利保护政策。它们是人体自身所具有的关于某一功能的生化、或者细胞生物学、或遗传学数据的基因序列。因此,我们同意专利向更切合实际的方向倾斜。

问:不久之后对基因组测序就不优先资助?

答:至少今后5年内,测序工作仍将在基因组的一系列的研究中居非常关键的位置。弄清楚这些基因序列需要多方面地进行比较。为此,我们已经在对小鼠基因组进行研究,其难度丝毫不亚于人的基因组。我们将采用不同的研究策略,但要读取小鼠整个基因组约6000万个碱基序列,仍是一件繁杂、而又史无前例的事。目前,对人、小鼠及其他哺乳动物的测序,还存在很大的分歧。两种动物的基因组进行比较将会非常有用,但3种动物的基因组进行比较则意义更大,尤其是正在寻找参与基因表达调控而又较短的保守元件时。很显然,我们今后在完成小鼠基因组之后,不会停止对其他脊椎动物进行研究。斑马鱼(绸带鱼)和大鼠的基因组的测序将会非常有用。猪、狗、牛以及其他灵长类的测序,现在还存在较大的争议。诸如其他灵长类动物的基因组是否需要全部测序,大多数有价值的序列是否可以从基因组草图中推出之类的问题,还正在探讨之中。

问:为什么不签订协议,有组织地对这些基因组进行测序呢?

答:假如我们确实想进行产品开发,合同这种方式尽管可能会引起争议,对测序而言仍是一种最有效的方法。在科研院所里可能会对大规模的测序工作发生激烈的争论,但是也可以获得很多有用的东西。如果你不进行产品的生产与开发,你将失去锻炼和丧失获得很好创意的机会。基因组研究必须在生物界所涉及的优先发展的严格指导下进行。

问:你对将来的基因组学研究有何新的打算?

答:上个月,一个具有独创性的设想已由我们的专家委员会批准,打算建立一些“出类拔萃的基因组科学中心”( Centers of Excellence in Genomic Science)。我们相信最有可能有重大突破发生在技术开发、计算方法、人群基因组学、基因表达分析以及蛋白组学等方面,因而由跨学科的研究人员组成的队伍倾力于共同的课题研究。我们希望有大量的研究经费以此类方式运作。在刚开始5年内,每年的计划拨出约400~500万美元投建此类中心。如果这些研究中心能够坚持鼓励人们去探索,我们肯定给予他们比通常3年更长时间的基金资助。他们可以获得新一轮的资助,但是大约10年后,他们将务必寻找其他经费来源。

问:眼下基因组计划最需要哪些帮助?

答:我认为应该是生物信息学。这的确给我们提出了挑战,我们最急需的是既懂数据处理又懂生物学的专家。我们急需青年人参与这项工作。现在,大量人才都流向私立的研究机构,这不利于对下一代人的培训。我认为科学界必须尽快解决这一问题。我在一些科研机构中谈及此事时,大学生们和刚入学的研究生们过来问我怎样才能步入计算生物学的殿堂。他们很快就会看到这一 天的到来;我们必须确信我们正为他们提供最好的训练。这些中心除做大量的科学工作以外,还打算为他们提供大量的培训机会。

问:人们期望基因组计划很快就能见效益,你对眼下发生在临床上的一些事情是否感到非常失望?

答:我一点都不失望,但非常焦虑。把基因用于临床的人都知道,该过程非常复杂,而不可预知的因素有很多。Herceptin 的事就是一个很好例子,它说明对乳腺癌的分子机制了解已经带来了新的治疗方案,从而获得显著的临床效果;但是还很难列出我们正从事的详细清单。我们必须现实一点,因为要想完全认识人类的基因组,并使之在临床上获得最大的效益,还要大约15至20年的时间。我们试图发布这样的信息:这将是继抗生素以来发生在医学领域里的最大的一次革命,但这场变革不是一下子就能实现的。

[Science,2000年3月31日]