在美国填字游戏锦标赛上,一名人工智能选手在1000多名参赛者中脱颖而出,赢得了比赛。就是填字游戏程序“Fill博士”。
虽然两个问题有错误,但是Fill博士一分钟就完成了比赛,比人类最快的选手快了两分钟。Fill博士得到了加州大学伯克利分校伯克利自然语言处理组的支持。它会对话题线索进行分析生成答案列表,并根据数据库中800多万组线索和答案进行解谜。
一、神经网络与数据库加持
Fill博士是由计算机科学家马特金斯伯格制作的,他也是一个填字游戏制作人。
从2012年开始,金斯伯格开始让Fill博士非正式地参与ACPT,并在年度竞赛中改进其软件。
今年,金斯伯格与加州大学伯克利分校的伯克利自然语言处理小组合作,该小组由丹克莱因教授领导的研究生和本科生组成。
克莱恩是自然语言处理和无监督学习领域的专家。他获得了2016年自然语言处理领域的AMiner十大最具影响力学者奖。AMiner是清华大学创办的新一代智能科技信息平台。
在ACPT开始的两周前,他们共同为菲尔博士开发了一个混合系统。其中伯克利团队利用神经网络帮助Fill博士分析线索,金斯伯格编写代码填充游戏网格。
Fill博士还有一个包含800多万条线索和答案的训练数据库,这些线索和答案来自于过去各种媒体上出现过的填字游戏。为了解谜,它的程序会参考以前的线索和答案。
和人类一样,在面临新的挑战时,Fill博士必须依靠经验来寻找新旧问题之间的联系。
比如《ACPT 2021》中第二个问题的答案是一个长单词后有后缀-ITY的新单词。幸运的是,2010年《洛杉矶时报(the Los Angeles Times)》发表的一个纵横字谜中出现了类似的问题。Fill博士的数据库里有这个问题,所以成功的解决了答案。
第二,它会分析线索,过滤答案
Fill博士的数据库虽然庞大,但是靠拷贝作业是拿不到第一的。
在实际的解题过程中,Fill博士会对题目线索进行分析,生成与题目线索匹配的候选答案列表,按照可能性进行排序,并检查是否可以与纵横字谜网格中的其他单词适当连接。只要题目给出足够的语境,Fill博士最终就能解决正确答案。
例如,对于“影响群体”的线索,Fill博士将正确答案“ARRAYS”列为首选词。“影响”一词从未出现在与正确答案相关的线索中,但这些线索中还有其他同义词,如“印象深刻”,使Fill博士能够推断语义联系,解决正确答案。
Fill博士还会对字母进行交叉匹配,过滤出正确答案。举个例子,一个五个字母的答案,知道第二个字母是O,答案的线索是“啊,真丢人!(真可惜!)”,它能找到正确答案“SO SAD”。
题目中涉及双关语或其他文字游戏的线索比较麻烦,但伯克利的神经网络系统使Fill博士能够识别这样的线索。克莱恩解释说,虽然这些语义技巧不能明确地教给菲尔博士,但通过机器学习,它可以理解寻找不像传统线索那样直接的选项。
第三,人脑还是比跳跃逻辑好
《纽约时报》的填字游戏编辑Wilshaw Shortz指出,今年的ACPT可能发挥了Fill博士的优势,因为“每个答案在语义上都很简单易懂”。Schotz说,他对Fill博士的原创性感到敬畏,但他相信人类选手在很多方面还是有优势的。
他说:“现在,人类在像填字游戏这样的非逻辑现实世界问题上还是更擅长的。”在他看来,即使是相对简单的话题,Fill博士还是会犯一些人类无法犯的错误。
克莱因也看到了这一点,他还提到在自然语言处理领域经常出现类似的挑战。例如,人脑经常进行所谓的“多跳推理”,也就是说,人脑会使用大量不直接相关的知识来完成一次跳跃推理。
教人工智能遵循这种逻辑跳跃,意味着人们要从很多间接的表意语言中提取和总结出表达的逻辑。但目前Fill博士对这些不是“白话”的语言还是有理解上的困难。
克莱恩认为,Fill博士这次的表现只是我们从纵横字谜的线索中解读自然语言含义的第一步。谈到表达特殊委婉语的语言样本,克莱恩说:“那些让人们困惑的语言,更让Fill博士困惑。”
结论:高级人工智能自然语言处理,从输出到“思考”
APCT Fill博士的胜利标志着人工智能在自然语言处理方面的进步。也就是说,人工智能不仅可以实现简单的自然语言交流,还可以“理解”复杂的语义,并“思考”如何解谜。
未来,随着科学家对自然语言含义认识的深化和系统化,这些人工智能的“思维”能力可能会更接近人脑,更强大。
版权声明:内容来源于互联网和用户投稿 如有侵权请联系删除