[摘要]神经计算是一门涉及神经网络的设计实现反应用的新的工程学科。神经网络是非算法的计算结构,其拓扑是有向图,它可以通过对连续或初始输入的状态响应来进行信息处理。神经网络中的节点称为处理单元,有向边(信息通道)称为互连通路。神经网络已经表明能够进行如下的信息处理操作:感觉信息处理(模式预处理,模式识别),知识处理(知识表示,从数据中自动抽取知扠,对不精确及矛盾的知识进行推理)和控制(平滑,快速机器人手腿控制,机器人“手眼协调”)。

一个神经网络是一拓扑为有向图的动态系统,它可以通过对连续及初始输入的状态响应来进行信息处理。神经网络中的节点称为处理单元,有向边(信息通道)称为互连通路。图1表示出了一个典型的神经网络。每个处理单元的输入输出关系都可以用一组差分或微分方程来描述。因而,完全的网络可以被看作是由差分或微分方程组成的大系统。

3.1

神经计算机是经专门设计以实现这样的方程所构成系统的信息处理机器。通过尽可能地利用这种方程的结构的优点,神经计算机在实现神经网络时,效率要比同等规模的通用计算机高出一到三个数量级。神经计算机的功能好像是标准的冯 · 诺意曼计算机的协处理机,因而就可以把这两者的优点自由地结合到一起。在神经计算机上实现的神经网络可以用一种标准的与机器无关的神经网络描述语言表示出来,这种语言有如HNC公司AXON语言。这样的描述可以用一个术语称之:网络件(netware),它是软件的神经计算等价体。要实现的网络件由软盘或主机上的数据文件装入神经计算机,当需要时就可以由主机软件裯用。神经网络的调用同任何其它软件过巷是一样的,唯一的不同是由神经计算机协处理机来处理的。标准的网络件包可以实现各种重要的神经网络,这种包目前正在开发之中。可以预言,神经计算机的绝大多数用户将会发现这样预先包装好,经过调试的标准网络件足以应付他们的绝大多数需求。

为了对神经网络所能处理的信息处理操作的类型有一个印象,先提出两个特定的理论性结果。第一个结果是柯尔莫哥洛夫(kolmogorov)于一九五七年提出的连续函数表示定理。

柯尔莫哥洛夫映射神经网络存在定理

给定任一连续函数Φ:EmRn,Φ(x)=y,这里E是闭单位区间[0,1](因而,Em是m维单位立方体),Φ可以精确地由一个三层神经网络实现,此神经网络的第一层有m个处理单元(x - 输入),中间层有(2m+1)个单元,第三层有n个处理单元(y - 输出)。

柯尔莫哥洛夫定理保证任一连续映射或函数都可由一个小型神经网络实现。但这并没有为构造这样一个网络提供一个方便的手段。这是如下结果的内容。

反向传播网络构造定理

给定一个例子集合{(x1,y1), (x2,y2),…,(xL,yL)},此集合是连续函数Φ:SmSn的动作集合,这里Sm和Sn分别是m维和n维欧几里德空间中的单元圆,并且对所有的i=1,2,…,L,有Φ(xi)=yi,可以构造一个具(2m+2n+L)个处理单元的五层神经网络来实现函数ψ,使得ψ(xi)=yi,并且使得如果xj要比其它所有xi(i≠l)更加趋近x∈Sm,则y=ψ(x)将趋近于yj。更进一步,如果Φ-1存在,那么网络就可以自动地实现映射ψ-1使得交换x和y后仍具以上性质。最后,对任一N>0,—个具有(2m+2n+N)个处理单元的五层神经网络都可以被构造出来,以使得关系ψ(xi)=yi(和ψ-1(yi)=xi,若ψ-1存在的话)对所有i都近似成立,误差在最小均方的意义下是被极小化的。这个定理的证明用到了格罗斯伯格(Grossberg)的外星(outstar)和竞争网络定理以及柯哈南(Kohonen)的自组织映射定理。

因而,在映射实现的情况下,神经网络理论为在例子基础上发展数学映射,变换和函数提供了手段。在很多方面,这都可以被看作高等统计技术,它使得在设计网络时体现已知的限制,并且允许网络根据串行地呈现给它的例子自组织想要的数学运算成为可能。利用这样的网络,没有必要存贮用来规定网络的条件的数据。数据可以被采集,使用,然后抛弃,正如生物系统一样,当新数据变得有效时,逐渐地对之综合的能力(而不是把数据汇集起来)是优于其它典型的计算机技术的主要优点。这使得神经网络能够有效地处理对于现存的或正在设计的计算机来说大得难以处理的数据集合(如需时几千小时的图像数据,需时上万小时的声呐数据等等)。

除了在大的数据集合上进行自组织的能力外,神经网络比传统方法还有其它一些优点,例如,神经网络结构可以进行O(1)——时间的并行近邻搜索,搜索时间与存贮的项(模式,知识,等)的数目无关。它们还可进行并行的相联存贮器操作和假设检验操作。

神经网络也许被最好地设想为至少提供了某种“缺省能力”,这是计算机科学努力了40年都不能做到的。特别地,诸如连续的语音识别,图像模式识别,声纳和雷达信号采集,不精确知识处理和控制算法的自动学习等等操作现在通过使用神经网络都变得现实可行了。很清楚,标准的算法计算和神经网络彼此间重叠的很少。神经网络无法用于计账。算法无法用于连续的语音理解,随着计算机和神经计算机之间的简单接口的开发,我们现在可以同时使用两种技术。对于特定应用,已经开发了许多组合的软件/网素件包。这种组合可以为控制件(Cyberware)。

神经计算机技术现已发展到这样一种程度:大的足以求解许多现实世界问题的神经网络可以很快地实现,并且其大小,重量,电源和价格都是负担得起的。光学计算技术似乎非常适合于神经计算的需求,当在以后十年内将光学计算部件加入到神经计算机中时,我们可以预期应用的范围会拓广。可以得到这样的结论,冯 · 诺意曼计算机不能开拓这些先进的革新(由于软件开发和软件并行性的限制),因而使得神经计算机成为未来计算机的主要的发展因素。在下面几节中,将设想一些神经网络的潜在应用。

传感器处理应用

传感器处理涉及到两个主要的问题集合:模式预处理变换和模式识别。预处理变换接受一种形式的模式,把它们转换为更多的想要的或可用的形式的模式。这样的例子包括:图像压缩/扩充,图像边缘抽取,图像对比增强,图像或信号的基础函数(Fourier,Fourier-Mellin,Gabor)扩充和模式噪音压缩。模式识别则是把一模式映射到其类号的操作。这可以是固定的静态的映射,或许是更复杂的操作,如基于以前接收到的模式和存贮的例子模式的假设检查。神经网络可以执行许多模式预处理变换和模式识别操作,还可以处理空间模式(固定的图像,固定的能谱)和空间时间图像(动态的视频图像,连续的语音,声纳和雷达的多普勒音频)。现在讨论用于传感器处理的神经网络的特定例子及其若干应用。

Grossberg/Mingolla的视觉处理网络和福岛邦彦的新认知机已经表明模板驱动的图像分割和位移/比例/转向无关的图像模式识别对于神经网络是可能的。所有这些工作一直是在小问题的水平,上进行的,各个部分尚未结合到一起,但使用的技术似乎可以直接扩充与组合以求解完全规模的图像模式识别问题。假设这是对的,那么下面开列的应用似乎就是可行的了:

1. 对于图像的自动的客体获取和分类。部分模糊的密林可以被定位。

2. 机器人的实时图像分析。可以支持诸如自动的刷漆、洗涮、组装等操作。

诸如作者提出的频谱模式识别网络已经表明了通过把时变的能谱与已存贮的例子进行比较而对时间序列模式分类的能力。这种空间时间模式分类方法在理论上已被证明提供了很高的(近于贝叶斯)分类性能,近优化的噪音抵抗能力,并且对于与现实世界规模相当的问题是可扩充的。这种方法看来对于连续的语音识别是具有价值的。

总之,神经网络对于求解模式识别中的许多长期存在的难题是极具前途的。

知识处理应用

神经网络可以从数据自动地获取知识,逐步地把新数据结合进其映射函数,并执行逻辑的假设检验,通过这些能力,神经网络非常适合于处理某类知识。一般而言,如果一个问题涉及高度定的或确定性的知识,则最好使用传统的软件和人工智能技术来处理。神经网络看起来最适合这样的情况:知识主要涉及因果关系和一般性,数据中可能存在矛盾和错误。

目前已经开发了三种重要的神经网络知识处理范式。下面就对之作一简述,并讨论其潜在应用。

第一个是Anderson的知识处理神经网络,它是通过把知识编码为长的属性向量来进行工作的。这个系统非常可靠,可以有效地处理矛盾与丢失的信息。在矛盾的情况下,它基于“证据权”作出决策(即,选择具有最多的支持例子的响应)。在丢失信息的情况下,系统在现有的属性之间已知,联系的基础上进行猜测。这个系统的缺点是它要求有一个“硬”的知识库。换句话说,用来构造系统的数据必须是精确的,不能是模糊的。Anderson已经表明,通过把每一病例编码为具有症状,诊断,治疗和对治疗的反应等的多个属性的一个向量,可以直接从病人的病历中抽取出知识。Anderson系统对于从数据库中抽取隐涵的知识是有用的。这对于希望更完整地研究现有的数据库的医学信息科学部门可能是有价值的。

第二个是Kosko的模糊认知映射系统,它是以神经网络形式实现的类图的结构,它能够存贮作为变元概念的客体之间的因果关系。模糊认知映射可以处理不精确的,矛盾的,和错误的数据。这个网络看起来非常适合于涉及到个体交互的知识基础之上的复杂系统或组织的模型的发展。例如,一个对抗的运动队或公共高级管理队的功能模型一一允许使用反对它们的策略分析。

第三个是Carpenter/Grossberg的适应性共振网络,此网络能够进行假说检验和逻辑推理运算。它可以使用现有的知识来判断一个给定的假设的“合理性”。它还可以对给定的项检验相关的知识项的一致性,以使找出最可用的现有知识。因为相关的项是通过并行搜索的办法而查询到的,所以这个过程一般在一到三步就可以完成。如何应用这种能力的例子包括:

1. 上下文相关的时间序列数据的模式识别系统可以利用这种能力建成,以检验作为假设的时间局部的分类,这是相对于以前的数据提供的上下文信息的。

2. 有关机器人活动的规划的初步假设可以相对于行为规则库检验其一致性。这为实现Asimov的“机器人三定律”的一种极简化的形式提供了机制。

总而言之,神经网络具有传统的知识库系统所不具备的实时知识处理能力。使用神经网络已经体现出了这种能力(虽然,目前研究的问题规模都很小),这种能力具有正确的“感觉”,这是由于这种能力内在地适应于实际世界的数据,并能处理模糊性,不确定性,矛盾及错误。

应用于控制

把神经网络应用于控制至少可以回溯到一九六二年。那一年,斯坦福大学的Bernard Widrow表明一个网络可以成功地学会平衡一个干扰抑制器的控制算法。自那以后,利用神经网络技术已经解决了其它几个控制问题。一个著名的例子是由约翰 · 霍普金斯大学的Terrence Sejnowski建立的语音合成系统,该系统利用正文块输入的办法来控制一个声音产生器。这个系统的性能要优于或等于最好的商用语音合成系统。现在再讨论两个有前途的控制网络方法及假想的应用。

第一个是Grossberg/Kuperstein的视觉运动控制神经网络,这个网络已经表明能够执行传动器表面的一个图像传感器的反馈控制和图像平面的非线性关系的计算。这个网络还能够把图像传感器瞄准到正在运动的指定的客体上。更进一步地,它还能为以前的客体序列产生扫描模式。这种技术的一个潜在应用是机器人系统的摄像机控制。这就使得机器人通过瞄准感兴趣的客体(由一个观察整幅图像的神经网络进行选择)来更精确地执行模式识别。

第二个是Rumelhart/Williams的后向传播网络,此网络已经表现出近似的任意空间映射的能力,这是通过对映射的例子进行自组织反应完成的(正如上面讲到的反向传播网络构造定理一样)。Sejnowski正是用这种网络来建立他的语音合成系统的。已经表明这种网络对于许多传感器处理,知识处理,和控制的应用都是有用的。这种网络的一个可能的应用是先进的飞机控制。这种网络可以用来从模拟器中的飞行员处直接学会控制定律。这种网络可以“坐镇”一般的稳定性增强和控制安全性系统,并负责决定操纵杆的“感觉”以及各种飞行控制的响应(机翼/尾翼的构造,g - 负载,起飞设置,速度制动设置)。这种网络可以进行改进,以用于极小化某些选定的量的平均方(如平均的操纵杆导向,以及转向时的转向率,等等)。我们很有兴趣地注意到这些思想已经以简化的形式在飞行中进行了实验。在1969年,F-100超音速喷气机在飞行中使用了神经网络控制系统。这项实验成功了,但由于神经网络是非算法的,而且仅仅简单地从数据中直接学习,当今的工程师还不愿意接受这种方法。今天的多功能数字控制系统,在高层系统失败时,具有自动地转换到更简单的子系统的能力,而神经网络对于此时的飞行控制则更加适合。

总之,神经网络可以为控制工程师的拿手节目中增加许多新的适应性控制能力。

小结

神经计算技术的时代已经到来。现在看起来有可能神经计算可以解决许多传感器处理的问题,而对于这些问题,已经用其它方法苦斗了三十多年。类似地,在知识处理中,神经网络为处理具不精确性,矛盾和错误的实际世界的知识提供了有效的手段。最后,在控制领域中,许多使用更便宜的器件来得到更好的控制的新的技术看来是可能的3对于磨损和部分损坏的补偿也是可能的。

[AFIPS,1987 p239 ~ 244