自然语言理解是人工智能研究中的热点和难点之一。关于机器感悟人类语言实质的理论研究可以追溯到80年代中后期的有关内省法的哲学大作业,其成果自2004年起相继得以发表,相关论文已发表五篇,引起学术界的关注。本研究的核心思想是强调最小的知觉元素的重要性,通过数学证明的方法来揭示语言理解的内在机制,最终达到与实验的方法同样的实证求是的效果。
其中《自然语言理解的机器认知形式系统》一文基于现有的相关理论,提出自然语言理解的形式化定义,以及改进相关的公理系统,从而统一“意思理解”和“道理理解”等两种理解类型。文献[1,2]对什么是理解及电脑如何能理解人类语言给出回答。论文《基于语义本源的智能界定研究》结合人类理解能力在已有智能观点的基础上有给出智能的基于语义本源的一种界定。
其战略意义为:该研究对知识学习、问题求解、语言翻译、软件工程乃至软件生产自动化将具有深远的影响力;本研究也将为真正理解下的大规模真实文本处理及最终通过图林测试奠定重要的基础。
在语言翻译时,假设机器有了一些基本的事实及知识,当有了融汇贯通的能力,它就会触类旁通。它把旧的材料重新用知觉元素贯穿起来,然后可以根据需要重新生成新的信念,从而会不断从旧的材料中获得新的经验。这个过程就像造纸一样,把纤维用水捣烂搅拌最后融化成细小的纸浆,再根据需要生产出符合需要的纸产品。
根据语言理解理论[1],篇章理解包括句子理解与上下文理解,句子理解需要理解后的知识,上下文理解也是依靠知识的匹配理解证明过程。但现成的适当的知识常常比较缺乏,这些知识往往来自于触类旁通的知识,所以面向机器的融汇贯通特别重要。
建立在理解之上的融会贯通将从本质上提高知识的利用率及好用性,从而语言理解理论也将对软件工程,特别是软件生产自动化方面具有重要意义。我们相信,语言理解理论将把人类使用图灵机从繁琐的对思维模拟而去建立无穷尽的形式系统中解脱出来。这也是语言理解理论研究的动力和目的所在。
参考文献: