与人类唇枪舌战的论证技术

发布时间：21年05月28日

编译高斯寒

以色列科研人员开发出一套完全自主的计算机系统，能够参与和人类的实时辩论。他们的研究结果暗示，未来的人工智能将有能力理解复杂论证的含义，帮助人类作系统性阐述。

对于论证的研究在学术界中源远流长，能追溯至古希腊时期，并且横跨从理论哲学直至计算工程的多个学科。在人工智能研究领域，开发能够在人类自然语言中识别论证的计算机系统是最耗时费神的挑战之一。以色列学者诺姆 · 斯洛宁（Noam Slonim）等人在《自然》杂志撰文，报告了该研究领域一项让人惊艳的进展。他们开发的“辩手项目”是一个人工智能系统，能够在辩论竞赛中与人类交手。他们的研究报告展现了该领域研究进展的程度，并且强调：研发能在辩论中识别、生成和评论论证的技术时，稳健工程非常重要。稳健工程就是将不同组件结合在一起，每个组件负责处理某个特定任务。

对人类论述作分析，从而识别出引用证据、支持结论的具体方式，这个过程现在被称为论证挖掘（Argument Mining）。10年前，当时的尖端人工智能的性能还不足以完成论证挖掘的工作。从那时起，人工智能技术取得不少进步，论证技术的工程化也日益成熟，再加上强烈的商业需求推动，这三个因素促使论证挖掘的研究版图迅速扩张。放眼全球，目前共有50多家实验室从事这方面的研究（包括所有大型软件公司的研究团队）。

这个研究领域出现爆炸式发展的原因之一是，能在大量文本中识别出语言使用的统计规律的人工智能系统直接应用在人工智能的许多方面具有变革性；但就其本身而言，并未在论证挖掘上取得同等的成功。这是因为论证结构过于变化、过于复杂、过于微妙、过于隐含，以至于无法像句子结构一样容易识别。因此，斯洛宁等研究者决定发起一项巨大挑战：开发一套完全自主的系统，能够参与和人类的实时辩论。“辩手项目”就是这个研究工作的亮点。

辩手项目首先是一个巨大的工程壮举。它汇集了从文本中收集和解释与争论相关的材料的新方法，以及修复句子语法的方法（使系统能够在提出其论点时重新部署提取的句子片段；语法修复技术的作用被作者适度低估）。辩手系统的这些组件由人类围绕关键主题而预先准备的信息结合在一起，从而为广泛的主题提供知识、论证和反证。这个知识库有预备好的文本（人类事先写好的句子片段）作为补充，用来在辩论时引入和组织陈词。

辩手项目野心勃勃，它既是人工智能系统，也是对人工智能研究的巨大挑战。对于将视野定得太高的几乎所有人工智能研究而言，其主要瓶颈便是获取足够多的数据，以便能针对挑战，计算出有效的解决方案。辩手项目已经用双手策略处理了这个障碍：一方面，它缩小范围，聚焦于100个左右的辩论主题；另一方面，它从大型数据集（即便以现代语言处理系统的标准来衡量）中采集原材料。

在2018和2019年进行的一系列竞赛中，辩手项目和多位有才华、著名的人类辩手进行了辩论，观众以非正式的方式评估了它的表现。该系统依靠论证技术，受到它所处理的数据集的推动，生成4分钟的发言，开启辩论；辩论主题来自系统存储的主题资料，接着由人类辩手进行回应；系统再对其对手的论点做出反应，生成第二段4分钟的发言；人类辩手发表4分钟的辩驳作为回应；最后双方分别给予2分钟的总结陈词，辩论结束。

“辩手项目”与人类辩手唇枪舌战：斯洛宁等研究者研发出人工智能系统“辩手项目”，它能参与和人类的辩论比赛

系统最薄弱的方面大概是它要竭尽所能来模仿人类辩手的连贯思维和流畅语言——这个问题与它的处理流程能够选择、摘要和编制论证的最高水平有关。然而，这一局限并非辩手项目所独有。尽管有两千年的研究，人类对论证结构的了解仍然很差。辩论研究的重心（语言使用、认识论、认知过程或逻辑验证）不同，关于论证和推理的连贯模型至关重要的特征也千差万别。

因此，构成良好论据的模型极其多样化，而构成良好辩论的模型只不过是形式化的直觉。所以，并不奇怪，辩手项目的表现评价仅仅是询问人类观众，问他们是否认为人工智能系统可作为“表现出色的榜样”。在几乎三分之二的主题辩论中，观众认为人工智能系统足以充当榜样。

所有论证技术体系都会面临的最后挑战是：将论证当作受到一组孤立考量影响的局部论述片段，还是将论证置于社会层级辩论的更大范围？在很大程度上，这是设计要去解决的问题，而不是工程化解决方案。给论证限定“先验”的范围，理论上的简化就成为可能，并能提供较多计算优势。譬如说，识别出“主要主张”是定义明确的任务，用机器来完成和靠人来完成几乎一样可靠。问题是人类根本不擅长这项任务，正是因为它是人为设计的。在开放讨论中，特定的论述在某种语境中也许是主张，而在另一种语境中就可能是前提。

不仅如此，在现实世界中，并不存在论证的明晰界限：在辩论室之外发生的话语不是孤立的，而是与交叉引用、类比、例证和概括的网络有关。人工智能要如何才可以攻克这样的论证网？相关想法已经在理论中出现，并用软件予以实施。譬如说，有个名叫“辩论图表”（Debate Graph）的系统属于互联网平台，向使用者提供计算工具，将复杂和关联的思维网络进行视觉化和分享。然而，理论挑战以及与实施相关的社会技术问题难以克服：设计引人注目的方法，吸引大量受众到此类系统与设计能够与这些复杂的争论网进行交互的简单机制一样困难。

辩手项目是论证技术发展的关键步骤，也是将论证当作局部现象进行工作的关键步骤。它的成功展示了人工智能系统如何与争论网交互的动人一幕，人类可以轻松解读争论网。鉴于假新闻的泛滥、民意的两极化、懒惰推理的普遍性，这很容易掩盖人类在创造、处理、浏览和分享复杂论证方面迫切需要得到支持，而AI或许能够提供这种支持。因此，尽管辩手项目响应研究的需要去推进并解决了一个重大挑战，但它更代表了人工智能的进步，有助于人类推理。正如斯洛宁等人所说，这远远超出了当前人工智能技术的舒适区。

资料来源 Nature

期刊目录 contents

卷首语

专稿

物理学

生命科学

医学与健康