为什么要配置停用词?

在配置意图的过程中,发现在A意图中配置了语料Are you a Robot, 但是实际测试时,输入are you a robot会匹配到其他语料,这是什么原因造成的呢?

原来系统中未将Are配置为停用词,造成机器人将are进行词形还原成be,而语料中存在is,也一样进行词形还原为be,所以导致输入“are you a robot”时系统根据语料匹配到其他意图。这种问题可以通过配置停用词解决。

实际语言中存在一些词,并没有实际含义,仅起到连接作用,例如英文中的BE动词,中文中的助词“的”等。为了使这些词不参与语义解析,需要将这些词在知识管理 > 实体管理“停用词”页签添加。

图1 停用词列表