英国的e-科学核心计划

 

9.1

 

核心计划的结构

正如我们已经阐述过的那样,e-科学核心计划的目标是,使由e-科学产生的对通用的中间件的需要统一起来。通过与科学家、计算机专家和产业界的合作,e-科学指导委员会发布了一项框架开发的指令。这项指令将会促进健全的、有产业优势的网格中间件的出现,它不仅可以支持单一的应用领域,而且可以同工业和商业联系在一起。

e-科学核心计划将围绕以下6个关键要素构建:

1.在现有e-科学中心网的基础上建立一个全国性的e-科学网格测试台;

2.促进通用的网格中间件的开发;

3.跨学科研究合作(IRC)网格项目;

4.建立一种e-科学领头项目的支持结构;

5.支持国际活动的开展;

6.支持e-科学的网络化要求。

以下,我们将对这些活动的每一项进行讨论。

英国e-科学网格和e-科学中心

目前英国已建立了9个e-科学中心,其中建立在爱丁堡的一个为全国e-科学中心,由格拉斯哥大.学和爱丁堡大学共同管理,其他8个为地区中心,分别建立在贝尔法斯特、加的夫、曼彻斯特、纽卡斯尔、牛津、剑桥、伦敦和南安普敦,范围几乎覆盖了整个英国。其中,设在曼彻斯特的e-科学中心承担了全英国的超级计算机服务。这些中心具有以下3种功能:

(ⅰ)使用一套标准的网格中间件配置重要的计算和数据资源,以形成构筑全英国的e-科学网格的基础;

(ⅱ)产生一种合作的工业网格中间件和工具项目的文件库;

(ⅲ)在本地区内普及网格的信息和经验。

Rutherford和Daresbury实验室是英国e-科学网格的重要据点,而落户在Hinxton的欧洲生物信息学研究所(EBI)、桑格中心和MRC研究所构成了全世界重要的基因图数据中心之一。因此,重要的是这个据点需要足够的带宽与e-科学网格连接在一起,以支持大量的e-科学生物信息学项目。

设在爱丁堡的全国中心建立了“e-科学研究所"。该研究所将组织一系列来自全世界的科学家和专家参加的多学科研讨会。研讨会的形式从为期一天的研究班到2002年夏天举行的为期一个月的“e-科学节”等,组织这些活动的目的旨在使该研究所成为一个国际知名的、对促进e-科学发展进行讨论的中心论坛。此外,英国在每-一个e-科学中心还建立了AccessGrid中心点,以促进和加强国内外的合作。AccessGrid系统是美国阿贡国家实验室开发的,可以提供一种在不同地点进行的更自然的电视-会议体验,并能将网格模拟同直观显示结合在一起。

促进网格中间件发展

为使英国的计划取得成功,我们必须从起点提供项目支持,并且从创建和运行网格所必需的经验着手培养一支核心队伍。为此,联系着9个中心的英国e-科学网格和两个CLRC实验室,将被用作一种双向试验台。如前所述,最先选用的中间件与NASA用在IPG中的一样(IPG称作一种“内部网格")。就英国.的e-科学网格而言,是用不同的IT政策、防火墙等连接不同的大学,这是一种基本的Globus基础设施和以数字认证为基础的安全系统的测试手段。这些中心对把各种资源收集到网格上作出了贡献,包括超级计算机和成群的计算系统以及分散的数据存储系统。这种网格既可以用作一种新网格中间件的测试平台,也可以用作一种主要的工业项目可以取得的资源。

目前,这一核心计划正在同关注网格设备未来发展的IBM、Sun、Oracle和Microsoft等公司进行论证。令人鼓舞的是,IBM和Sun公司已经对推进健全的网格中间件生产作出了可靠的保证——研制并提供比现有网格中间件功能更多的软件,并且还可以用于工业产品的质量改善。今后会有从一开始就采用这种网格的工业部门出现,诸如石油化工业、制药业和工程设计行业等。到2003年或2004年,这种网格会对更一般的商业和工业产生重大的影响,这也是英国e-科学网格项目发展计划中的一部分。

除此而外,在着眼于整个网格的构造方向上,爱丁堡全国e-科学中心还建立了一个网格体系结构专门工作小组(ATF),其任务是制订一个为网格中间件发展所用的英国网格“路线图”,旨在使某些短期目标与长期目标能够协调一致。由诺曼 · 佩顿(Norman Paton)领导的网格数据库特别工作小组(DBTF)则倾向于借助按网上服务思想提出的一种“网格服务”模型实施-种数据库接口。这便导致了将网格中间件设计成一种“服务导向体系结构”的想法,其提供的网格服务对象是更高水平的应用消费。

来自这两个专门工作小组的报告,将以白皮书的形式提交给近期召开的全球网格论坛讨论。我们希望能看到最终会制订出一套得到公认的“公开网格服务”规程,这种网格服务带有与操作系统和低于这一层次的RDBMS连接的专门接口,并且能为上述应用提供一整套网格服务。重要的是,至少是超越现有Globus模型的准标准规程能尽快得到公认,以确保网格中间件在应用项目中的开发可以有效地进行。我们打算同Globus的专门小组合作,并且帮助推进对这些标准实行开放源处理。

跨学科研究合作网格项目

英国的EPSRC已经资助了三项为期6年的与计算机科学(CS)有关的“跨学科研究合作(IRC)"项目,以便在以下3个领域进行长期的研究工作。诺丁汉大学汤姆 · 罗登(Tom Rodden)领导的“赤道”项目(equator project),关注的是物理寿命和数字寿命中的技术创新;南开普敦大学的奈杰尔 · 萨德博尔特(Nigel Shadbolt)领导的先进知识技术项目(AKT),研究的是知识寿命周期管理;纽卡斯尔大学的克利夫 · 琼斯(Cliff Jones)和兰开斯林大学的伊恩 · 萨默维尔(Ian Sommerville)领导的DIRC项目,关注的是以计算机为基的系统的可靠性。而由EPSRC和MRC共同资助的第4个IRC项目,是由牛津大学的迈克 · 布雷迪(Mike Brady)领导的MIAS项目。这一项目关注的是将医学图像和信号转化成用于医疗工作的临床信息。

这些IRC项目是经过公开投标程序选定的。作为软件技术在上述多学科应用领域内的重要性及由此而构建成的信息库,因此,核心计划对每一个这样的IRC项目均予以资助。此外,我们正在资助两项将Equator和AKTIRCs的软件技术同MIAS应用项目结合起来的合作项目。实际上,这些项目构成了一种“e-保健”中的“大挑战”(Grand Challenge)领头项目。

作为网格技术用于e-保健的潜力的具体案例,有必要研究一下迈克 · 布雷迪和他在牛津的研究小组正在MIASIRC项目中研究的问题。他们将精密的图像处理技术用于乳房X-射线成像和乳房肿瘤超声扫描。为了最精确地确定可能的肿块位置,他们必须建立一个乳房的有限元模型(FEM)。而网格中间件遇到的信息学上的挑战,是如何将乳房中肿块位置的准确信息传送给手术室中或附近的外科医生。显然,有许多涉及数据的安全和隐私的组织需要分辨,而成功地分辨这样的组织,不仅对英国的保健而言,而且对全世界的保健而言都必须予以优先的考虑。这也说明了网格的另外一面。医院并不特别想介入计算中心的业务,去做所要求的模型设计和现代医学技术需要的分析。他们更愿意去购买所需要的资源,而这些资源是建立在一种现购现付基础之上的“网格”服务。这说明,按照这种方式网格服务中间件可能会激发新的“应用服务供应商”行业的出现。

国际合作

有一点很重要,那就是英国的e-科学界要积极地与国际社会建立联系和合作。因此,有必要发展一个信息灵通的英国网格技术团体,以便在全球网格论坛会上达成国际认同的协议方面发挥一种积极的作用。为此,我们已经资助了一个“Grid Net"网络项目,它为英国专家参加相应的团体(如像全球网格论坛、IEIF和W3C)的活动提供一项基本差旅费预算。

英国的计划还注意与某些国际研究计划(项目)建立有意义的联系,这些项目有如EU DataGrid和USIVDGL。因此,我们资助为英国国内年轻计算机科学家设立的网格奖学基金会,使他们能参与这些项目。全国e-科学中心有责任与美国阿贡国家实验室、圣地亚哥超级计算中心建立工作协定。我们还打算建立其他的国际联系和合作计划。

连网

英国e-科学应用项目,将依靠英国的大学网络Super JANET4来传送必需的带宽。目前,Super JANET4的基本带宽为2Gbps,在2002年年中将带宽提高到10Gbps。为了收集来自英国的e-科学项目的网络需要——借助可接受的等待时间和必要的带宽——建立了一个网格网络小组(GNT)。他们的近期打算是确定瓶颈和潜在瓶颈的位置,从更长期看是重视服务质量问题。一个同UKERNA和CISCO合作的OOK项目,就是考察在通信工程中存在的问题。而另一个项目,关注的是计划与EU DataGrid项目合作的带宽问题。这两个网络研究与开发项目,均受到核心计划和PPARC的共同资助。

示范项目

核心计划还资助了许多“网格示范项目”。关于:示范项目的理念,是指那些能用现有的技术来表明在不同领域中应用网格的潜力的项目。我们已在许多应,用领域选择了示范项目,其中包括一种动态大脑图谱、一种采用VR的医学成像项目、一种机器人似的望远镜、自动化数据收集和天气预测(www.research-councils.ac.uk/escience)等。

结 论

在我们意识到上所述的e-科学和网格观念之前,还有许多挑战需要应对。这些挑战不仅仅是指诸如可测量性、可靠性、共享性、故障容限、资源管理、性能和安全等技术方面的问题,而且还有更多的有关合作的以人为本的问题和资源与数据共享的问题。

作为一种技术问题的案例,我们相信,实际的功能评估对实现网格作为一种全球性的资源市场的观念来说,是至关重要的。NSF和GrADS项目,设想了一种“性能合同”框架,用作资源的供应者和消费者之间的动态谈判过程的基础。就实际的性能预测而言,我们需要可靠的数据收集设备,它们可以监控可利用的分散的资源的容量,并且利用统计模型预测未来的性能水平。性能预测和资源管理是网格环境中复杂的任务。对科学的利用它的有限的资金而言,共享以如此昂贵的代价收集到的科学数据,显然是最重要的。然而,对于任何个别的科学家而言,他们的动机因素并非如此明确。也许赞助单位有必要增加某些奖励以鼓励这样一种共享科学数据的公众意识方法。

还有许多其他方面的挑战。在英国的计划中,有两个尚未引起重视的方面:安全和科学数据管理。对于要想在工业和商业部门获得成功的网格观念而言,中间件必须确保能够抗破坏。在这方面,目前采用的Globus同防火墙的相互作用是极不完善的。另一个问题是关于科学数据及与其有关的元数据(metadata)注解的管理和保存。一个短短3年的计划,显然是不能够对这样一个长期的问题提供一种解决办法的。但是,这一问题必须在不久的将来得到重视。我们目前对e-科学的资助,已能使英国开始着手去解决这些问题,并使英国能在国际网格界的发展中发挥一种积,极的作用。如果网格中间件能在未来几年中使e-科学在商业和工业应用方面取得成功的话,必定会有许多新的应用领域有待开发。

[Future Generation Computing Systems,2002年第18卷]