基于RISC的晶片机使许多计算机可作分子动力学研究、逻辑模拟等。

传统计算机和计算技术不适合许多科技应用。我们在巴勒摩大学的研究证实,平行多处理机系统和平行计算可提高以下各种用途的运算速度与效率,并降低费用,如量子力学计算、蒙特卡罗与分子动力学模拟、图像与信号处理、人工智能、机器人学、逻辑模拟和计算机辅助设计等。

分子动力学(MD)、分子间相互作用研究和新电子线路的设计,这些用途都由平行处理技术的模拟加以充分研究过。

我们用英国布里斯托Inmos(英莫斯)公司的晶片机(transputer)微处理机及其对于这些用途的连带平行软件的研究结果表明,运算速度提高达850倍。这些成果的取得,是将16个晶片机的阵列用于MD模拟,并与普通VAX-11/750计算机作比较。

晶片机是一种新型简化指令系统计算(RISC)机。当最频繁使用的晶片机指令以一字节(8信息位)编码时,就提供一种可产生达32位的变长度指令的机制,使程序编码紧凑,并使昂贵的存储器芯片得到有效使用。作为比较,AMD29000和莫托罗拉公司88000 RISC处理机具有32位指令长度并需浮点运算的外协处理机。这一设计再加上占用较多插脚(169个以上,而晶片机只用84个),使这两种处理机对大型多处理机系统来说,比晶片机复杂。

16位(T212)和32位(T414和T800)晶片机皆用CMOS(互补金属氧化物半导体)工艺制造。这些芯片结合接口适配器和纵横线转接开关,可用于大型程控系统。T800具有32位处理机、芯片内4千字节RAM(随机存取存储器)、浮点部件和四条串行线,尤适合科研计算。

晶片机及其“本国”Occam语言两者皆以这样的过程模型为依据,该模型使信息可在与晶片机串行线或RAM虚拟线对应的通道上进行交换,通信的过程等待不占用CPU时间。

晶片机虽有着许多优点,其大规模计算性能还在研究,如:(1)如何控制和改变阵列连接的拓扑结构,以便不仅静态(程序运行前)而且动态地响应平行程序的阵列映像要求,(2)如何运用检测设备监视各处理机的工作,使阵列处理机之间负载平衡良好和消除僵持情况。僵持的可能性及其诊断难度随多处理机平行系统的规模而增高。

这些研究计划其中两项是英国爱丁堡大学的爱丁堡平行巨型机(ECS),和P1085 Esprit(欧洲信息技术研究发展战略规划)计划。

ECS系统为科研和工商业应用提供多用户联网设备,目标组态是1024个T800晶片机。目前该系统拥有200个T800(每个有4兆字节)并可电子再组态,能为宽广的应用范围提供最大的灵活性。

ECS计划的实例有:

(1)神经网络模型,试图再现有关视觉、辨音、动作和相关记忆的神经细胞自然组合工作下大规模并行性的关键特点。

(2)用细胞自动化来模拟宏观连续介质现象(这用独立自由度有离散值的细胞阵列来完成)。

(3)用核磁共振之类的非侵入诊断法的医用图像三维显形。

(4)量子电动力学和量子色动力学等量子场论中的模拟。

Esprit的目标是发展高性能低价多处理计算机。该计划的许多工作中,有法国格勒诺勃大学研究组的高级编程环境研究和Inmos公司的晶片机改进,还有英国南恩普顿大学研究组用一种开关网络研究可再组态晶片机的结构,这种开关网络可辨别各通信晶片机的任一静态组态。

Esprit主要计算元件是含T800晶片机的模块,模块中还有256千字节或4兆字节RAM,系统内务用控制总线和监视阵列处理机性能的转换开关。

这样一些模块装在计算机底板上,底板可承载36个晶片机(包括控制晶片机)、磁盘操作器和外部线路。为数达64的这些“超级结点”模块可组合起来,以利用公共子系统的优点的分级设计构成大型计算机。

南恩普顿大学平行计算小组注目于Esprit机的应用,有下列三项计划:

(1)处理机栽培(farming),其中每一处理机运行的整个程序相同,而数据集不同。

(2)几何映像,这里将总计数据的小数赋予每一处理机(运行全程序)。

(3)算法分解,这是将可并行运行的几个算法部分装入不同的处理机(常连接而成几个处理机管)。

Esprit可再组态晶片机用途(全并行)有图像处理与合成、大规模科技算术运算和逻辑模拟。

分子运动模型化

晶片机阵列的应用包括分子系统力学统计模拟的运算,和借助联机平行数据处理使研究仪器增强。

扩大对简单伦纳德 - 琼斯液体和更重要的液态水的MD模拟能力的这一开发项目,已开始着手。我们希望扩充模拟,要使模拟时间超过VAX-11/750计算机的可能时间。

曾尝试过与克雷(Cray)公司X-MP巨型机联网以扩充计算能力,但是新程序调试中和大容量数据外存储器传送中的传输延迟,使这一选择方案不可接受。

我们将IBM兼容的PC/AT与加设的Inmos B004或微电路(Microway)公司单计算机板连用,来拟定Occam编码程序。板上容纳一个20兆赫T800晶片机、2兆字节RAM和将四条晶片机线路之一接于主计算机的接口电路。

单一B004或Microway单计算机板运行Fortran77程序,速度可为装有浮点加速器的VAX-11/750计算机的两倍。

lnmos晶片机开发系统软件已用于并行程序的折叠编辑、编译和装载。并还具备调试能力,可检查处理机网,查出运行时间误差。

运用Occam语言,可在完全模拟“形成”阶段,在—个晶片机上仿真要在多处理机目标系统中运行的平行程序。

这一目标系统是对开发系统加设一个或几个Inmos B003、Microway四计算机或等效计算机板组合而成。等效板上有四个T800晶片机和一个256千字节或1兆字节RAM。

联机图示装置由一Inmos B007板驱动。大容量温彻斯特磁盘机和盒式驱动器构成受主计算机控制的大容量存储装置。平行MD程序的执行,有两个平行性方案,方案Ⅰ,被模拟系统有数百个粒子,并考虑其间全部成对相互作用。

我们的方法,是将粒子及相互作用计算结果映像在阵列上,给各处理机均等地分配工作负载,这些处理机连接成环路。

八个20兆赫T800晶片机的心缩(Systolic)阵列,对256个水分子的MD模拟效率为80至85%,计算时间缩短为VAX-11/750的1/25至1/20。

这一阵列结构称为心缩环,因为每一处理机在算出其各自粒子间相互作用之后,将其粒子坐标矩阵的拷贝和力累加矩阵传至下一处理机。

在每一心缩脉冲作用下,每一处理机计算各自粒子与客粒间相互作用。切勿重复相互作用计算,并将计算结果存入客力累加矩阵。

心缩脉冲数等于处理机数时,每一力累加矩阵返回至其原来处理机 · 然后计算其每一粒子所受合力,并将粒子位置校正。

方案Ⅱ中系统粒子多于数百个,我们模拟研究低温低密度下二维伦纳德 - 琼斯系统发生的旋节相离析。研究相转变,需用比一般平衡模拟大的被模拟系统。而且对为数众多的粒子施以心缩管平行性(方案Ⅰ),会加大通信与运算时间之比,降低系统效率。

为此,对方案n已着手几何平行性探索,即给各处理机划定等积方格,二维模拟过程中粒子局限于格内。为减少处理机间通信,采取长程相互作用模拟中常作的假设,即定义一阈长rc,粒子间距大于rc时相互作用即为零。

确实,只要将每一处理机分配面积向前、后处理机扩大两个rc深度区,那么每一处理机就只要注意其扩大面积中的粒子。

除非系统控制器要求向监视器或大容量存储器输送信息,就一直维持局部信息交换。

已用这一程序完成了30%密度、55 K下7688个伦纳德 - 琼斯粒子二维系统旋节相离析的MD模拟。

我们研究过的其它用途还有用晶片机板改进现有仪器,设计新设备。由此产生的高性能系统联机计算能力高,并可对实验数据进行实时分析。

晶片机另一用途是改进激光光子相关器,使之能恰在下一次采集开始时自动采集显示于主计算机屏幕上的适用数据。晶片机与这一相关器的接口以Inmos CO11线路适配器为基础来实施。

我们的研究发现,晶片机可用来组装可再组态的复杂平行系统,应用于许多科技计算。特别是晶片机可使中小型计算机组排成高性能低价格地满足平行计算的需求。

[Research & Development,1989年11月]