麻省理工学院的研究人员创建的系统可用于自动更新Wikipedia文章中的事实不一致之处,从而减少了人工编辑现在人工执行任务的时间和精力。
维基百科包含数百万篇文章,这些文章需要不断进行编辑以反映新信息。这可能涉及文章扩展,重大重写或更多例行修改,例如更新编号,日期,名称和位置。目前,全球各地的人们都自愿花时间进行这些编辑。
在AAAI人工智能大会上发表的一篇论文中,研究人员描述了一种文本生成系统,该系统可精确定位和替换相关Wikipedia句子中的特定信息,同时保持类似于人类书写和编辑方式的语言。
“维基百科的文章需要不断更新。自动修改文章的确切部分,而几乎不需要人工干预,将是有益的。”计算机科学和人工智能实验室(CSAIL)的博士学位学生,主要作者之一达什·沙(Darsh Shah)说。“您无需花费数百人来修改每篇Wikipedia文章,而是只需要几个,因为该模型是自动完成或自动完成的。这极大地提高了效率。”
存在许多其他可以自动编辑Wikipedia的机器人。Shah说,通常,这些工具可以减轻破坏行为或将一些狭窄定义的信息放入预定义的模板中。他说,研究人员的模型解决了一个更棘手的人工智能问题:给定了一条新的非结构化信息,该模型会以人性化的方式自动修改句子。他说:“其他(机器人)任务更多地基于规则,而这是一项需要对两个句子中相互矛盾的部分进行推理并生成连贯的文本的任务,”他说。
共同主要作者和CSAIL研究生Tal Schuster说,该系统也可以用于其他文本生成应用程序。在他们的论文中,研究人员还使用它来自动合成流行的事实检查数据集中的句子,这有助于减少偏见,而无需手动收集其他数据。“通过这种方式,针对在事实数据集上进行训练的自动事实验证模型(例如,假新闻检测)的性能得以提高,” Schuster说。
Shah和Schuster与他们的学术顾问Regina Barzilay,三角洲电子工程学和计算机科学教授以及CSAIL教授一起研究了这篇论文。