配置知识融合时,如何选择融合标识符和配置属性
知识融合
知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧。
如图1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对这两条数据进行融合。
融合过程 |
过程说明 |
---|---|
初步筛选 |
知识融合需要初步筛选与融合标识符相似的实体数据。 |
判断属性相似度 |
初步筛选与融合标识符相似的数据后,需要配置相似属性和相似度函数,并判断数据之间的属性相似度。 |
融合知识 |
对属性相似度均达到阈值条件的数据进行融合。 |
综上所述,在创建图谱的过程中,需要配置知识融合的融合标识符、待融合的实体、相似度函数和相似度阈值等参数,KG服务会根据所配置的参数进行知识融合。配置知识融合的详细步骤请见配置知识融合。
如何选择融合标识符
融合标识符从所创建的本体属性中选择,例如有关于人物的知识数据,可以选择融合标识符为“name”,即初步筛选出与属性“name”相似的数据,也可选择融合标识符为“职业”,即筛选出与属性“职业”相似的数据。
如何选择配置属性
选择属性的时候,可以选择能够通过判断属性的相似度函数值就能判断出来两个实体是否相似的属性。例如对某一指代人物的实体,判断两个实体的属性“name”和“职业”的相似度均满足阈值,就可判断这两个实体实际上指代的是同一个实体。
具体选择什么属性来做这个判断,还要看您业务数据的实际情况。