懂语义的万维网

发布时间：01年07月27日

Tim Berners-Lee 编译郝建纲

一种能够被计算机识别的新型网页将可能引发一场革命，这场革命会带来诸多新的机遇——

作者介绍：蒂姆 · 伯纳斯-李（Tim Berners-Lee）是世界万维网联盟（W3C）的理事、MIT计算机科学实验室的研究员。他于1989年发明网络时，希望它能传送更多的语义信息，而不是仅仅停留在普通的应用上。詹姆斯 · 亨德勒（James Hendler）是马里兰大学学院园分校计算机科学的教授，他和他的研究生们开发了SHOE（第一个网络知识表达系统），此外，他还负责阿林顿国防高等研究项目署（DARPA）的代理计算研究。奥雷 · 拉斯拉（Ora Lassila）是波士顿的诺基亚研究中心的研究员、诺基亚风险投资首席科学家，还是W3C的顾问。

扩展信息

当皮特家的电话铃声响起时，他的音响系统正在播放甲克虫乐队的“我们可以做到”。皮特拿起电话，这时他的电话就向控制音响音量的装置发出了一条指令，使音响的音量降低。在电话另一头是皮特的妹妹露西，她正在医生的办公室里。露西说：“妈妈需要去看一个专家门诊，然后要接受一系列为期约两周的物理治疗。我现在就让我的代理去约定时间。”皮特当即决定和她一起去办此事。

在医生的办公室里，露西正通过手中的掌上浏览器指挥着她那懂语义的网上代理。她的代理很快就从医生的代理那里收到了关于她母亲的治疗信息，然后查看了一系列医院的列表，希望找到属于露西母亲的保险理赔以内、并且是在她家方圆20英里以内的医院。接下来，开始在所有可行的约见时间中（这些时间是由各个医院的代理通过他们的网站提供的）寻找能满足皮特和露西要求的时间。

几分钟后，露西的代理为他们列出了一个计划。但是，皮特却不喜欢这个计划。因为从他母亲家到这所大学医院要穿过整个市镇，这样皮特就不得不在高峰时间里开车返回。于是他让他的代理重新进行搜索，并且对时间和地点加上了更严格的限制。与此同时，露西的代理就当前任务对皮特的代理完成了认证，然后自动向它提供了访问许可，并且还提供了通向它已经存储的信息的快捷通道。

很快，皮特的代理就列出了一个新的计划：门诊部离家更近，约见时间也提前了。但是，他的代理也给出了两个警告：第一个警告是皮特将不得不重新安排他的几个不太重要的约会的时间。皮特查看了一下，认为这不成问题；另外一个警告是保险公司的物理治疗名单中没有把这个诊所列入。皮特的代理为了打消他的顾虑，紧接着提示说：“服务种类和保险计划状态可以通过其他方式来核实”，“是否要看详细说明？”正当皮特犹豫不决时，露西已经选择了“查看详细信息”，接着代理就列出了详细的信息。

表达意思

皮特和露西之所以能够利用他们的代理来做这件事情，并不是借助于当今的这种万维网，而应当归功于将来的语义万维网。现今的网页内容大部分是为人类阅读而设计的，而不是为了计算机程序能够理解它的意义而设计的。尽管计算机可以熟练地分析网页的设计和布局，而且可以反复地处理这里的标题，或那里的链接，但是，一般而言，它们不能处理下述文字的语义：这是哈特曼和施特劳斯物理诊疗所。这个链接将连到哈特曼大夫的履历。

语义万维网将为有意义的网页内容建立一种结构，并且创造一个软件环境，漫游于各页的软件代理可以在其中很容易地完成一些用户所要求的复杂任务。这种懂语义的代理在到了诊所的网页后，将不仅仅知道该页的关键词如“治疗、医药、物理疗法”等等，而且它还会知道哈特曼大夫工作在这个诊所里，他上班的时间是周一、周三和周五。它也知道网页脚本上的日期区间是yyyy-mm-dd的格式，并且能够报告约见的次数。值得注意的是，它在做这些事情的时候，完全不需要借助于当前规模的人工智能或者是星球大战计划中的C-2PO技术。相反，即使是从来没有学过计算机的人，比如这家诊所的经理，也可以利用一种用来编写语义网页的软件和物理疗法协会网站上的资料来编写他们诊所的语义网页。

这种懂语义的万维网并不是完全独立的，它是现有网络的一种扩展。在这种网上，信息有着更好定义的意思，从而可以使计算机和人能更好的协同工作。把语义网络编入现有网络的结构中的第一步早已经在进行中了。在不久的将来，当计算机能够更好地处理和理解那些它们今天仅仅是显示的数据时，这些发展必将带来许多新的重要功能。

万维网的本质特性就是它的广泛性。超链接的功能非常强大，可以把“任何东西与任何东西相链接”。正因为如此，现有的网络技术无法区分杂乱的草稿和润饰过的美文，也无法区分商业信息和学术信息，更无法区分文化、语言和媒体等等。不同方面的信息之间有着很大的差别，其中之一便是那些为人类理解而创造的信息与为机器工作而创造的信息之间的差别。一方面，我们接触到的是5秒钟电视广告以及诗歌之类的东西，而另一方面，则是数据库、程序以及传感器的输出。直到今天，网络只是作为人类所阅读的文档的一种媒介而快速发展的，不是作为能够被机器自动处理的数据信息而发展的，而语义网络的目的就是弥补这一不足。

与现在的因特网一样，语义万维网也会尽可能的分散。这样的网络系统不仅会使各个层次的用户（从主要的公司用户到个人用户）感到振奋，而且，它还有着无法料及的好处。但是，这种分散性也必然需要某种其他方面的让步：即网络将不得不放弃所有链接都完全自洽这一理想，而引入那条声名狼藉的出错警告：“错误404；找不到网页”，但也正是因为如此，才使得网络可以在不经审核的情况下得以快速发展。

知识表达

为了使语义网络能够正常工作，计算机必须要使用一系列有组织的信息及推理规则，以便能够用这些规则去进行一些自动推理。早在网络发展以前，人工智能的研究人员们就已经研究过这种系统了。人们通常把这种技术称为“知识表达”，它现在的处境就好比是网络到来之前超文本的处境一样——这固然是一个好主意，而且业已存在了一些非常好的范例，但是，它还没有改变世界。尽管它有许多潜在的重要应用，但是，要想认识到它的全部潜力，必须要把它连入一个全球系统中。

今天的网络搜索

传统的知识表达系统的模式是典型的集中模式。它要求每一个人都要使用那些公共概念的相同定义，如“父母”或“交通工具”。但是，需要指出的是集中控制模式是非常“沉闷”的，当系统的规模在快速增大时，它将变得无法驾驭。

传统的知识表达系统通常都对其可回答的问题做了非常仔细的限定，以便计算机能够可靠或者彻底的回答。这就使我们想起了数学中的哥德尔定理：任何一个复杂到能有实际用处的系统，都会遇到一些该系统所无法回答的问题，这很像是那个基本悖论“这句话是错的”的一种复杂表述。为了避免这种问题，每一个传统的知识表达系统通常都有针对它们自己数据库内容的非常狭窄、特殊的推理规则。例如，在一个家谱系统中，可能有这样一条规则“叔叔的妻子是婶婶”作用于家谱数据库。即使一些数据可以从一个系统传递到另外一个系统，但是这些规则通常是不可以传递的。

与此相比，语义网络的研究人员们则直接把这些悖论和不可回答的问题看作是网络广泛性的一个代价，而接受了它们的存在。用来描述推理规则的语言，其表达力需要非常强，以便能满足网络进行最广泛推理的需要。这一观念很像过去人们对网络的观念：在网络发展早期，批评者指出，网络永远都不会成为一个很有组织的图书馆。由于没有中央数据库和树形结构，人们永远都无法确定可以找到所有要找的东西。他们是对的。但是现在，因为系统的表达能力非常强，所以可以提供大量可用的信息，而且现在的搜索引擎也可以提供关于这些信息的非常完整的搜索指标（这在10年前看来是非常不现实的）。因而，语义网络的挑战性在于它所提供的语言不仅能够表达数据信息，而且还可以表达对这些数据信息进行推理的规则，此外它还允许这些规则从任何现存的知识表达系统中输出到网络上去。

使网络具有逻辑能力就意味着使它能够用一些规则进行推理、选择行动路线，并回答问题。但是，由于数学上的问题与工程上的问题混在了一起，因而使这项工作变得异常复杂。一方面，它的逻辑功能必须非常强，以便能描述事物的复杂特性。但另一方面，它的逻辑功能又不能太强，以免陷入悖论的怪圈。很幸运的是，我们所要表达的大部分信息都是诸如“六角螺钉是一种机械螺钉”之类的语句，而这些语句都是现有语言中现成的，只是有时会用到了少量特殊的词汇而己。

对于发展语义网络非常重要的两种技术早已到位了：可扩展标注语言（XML）以及资源描述构架（RDF）的出现。XML可以允许每一个用户去创立他们自己的标签和隐含标签，如〈邮政编码〉或〈母校〉，它们是用来标注网页或某个部分页面的。脚本或程序可以用非常复杂的方式来调用这些标签，但是脚本的作者也必须知道网页的作者究竟是用这些标签来代替什么。简而言之，XML允许用户在他们的文档上添加任何的结构，而无需解释这些结构的意义是什么。

语义网络将使计算机能够理解语义文档和数据，而不是理解人类的演讲和文章。

文字的意思是由RDF来表达的，RDF把句子的意思三个三个分成一组，每一组的结构类似于一个基本句的主语、谓语和宾语。这些组可以用XML标签来编写。在RDF中，一个文档将说明每个具体的事物（人、网页或其他任何东西）所具有的某种属性（如，“是某人的妹妹”，“是某文的作者”），而且这些属性都有相应的值（另外一个人，另外一个网页）。对于描述大量由机器来处理的数据，采取这种结构是非常自然的。主语和宾语将分别由其各自的整体资源识别器（URI）来识别。路由器（URL）就是一种最常见的URI。谓语也通过URI来识别，这样每个人都能通过定义一种新的概念或一个新谓语的URI来在网络的某处定义一种新的概念和新的谓语。

在用同一个词语去描述不同的事物的过程中，人类的语言得以发展壮大。但是对于自动控制领域而言，情况却并非如此。设想一下，如果我雇佣了一项非常愚蠢的快件服务来为我的客户们在生日时送去气球。但不幸的是，该项服务在把客户们的地址从我的数据库传到它的数据库时，并不知道我的数据中的“地址”实际上是寄送帐单的邮寄地址，而且大都是一些邮政信箱。这样所导致的后果便是我所雇佣的“小丑们”款待了邮局的工人。尽管这并不是什么坏事，但是它却没有达到我要达到的目的。如果用不同的URI来标识不同的概念，就可以解决上述问题。因为这样，就可以区分开邮寄地址和街道地址，还可以把它们同演讲区分开。（译注：英文中，address既有地址之意，又有演讲之意）

RDF组还可以把相关事物的信息连成一个网络。因为RDF可以用URIs把信息编码到一个文档中，而URIs又保证了这些概念不仅仅是文档中的文字，而且还与一个唯一的、任何人都能在网上找到的定义相联系。例如，设想我们可以访问各种关于人员信息（包括他们地址在内）的数据库，如果我们想要找到居住在某特定邮政编码地区的人，我们需要知道在每个数据库中哪个域代表姓名、哪个域代表邮政编码。通过利用URIs而不是一条条的短语来对应上述每一项，RDF完全可以确定诸如此类的信息。

（未完待续）

[Scientific American，2001年第4期]