配置信息抽取简介
在创建知识图谱时,当您选择本体后,您需要配置信息抽取,输入实体类型、抽取函数及抽取前后的数据字段,才能进行配置信息映射、配置知识融合等操作。
基本概念
信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。
配置方式
信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。
配置方式 |
适用范围 |
具体方式 |
操作指引 |
---|---|---|---|
结构化抽取 |
基础数据格式为xlsx、csv、json格式 |
交互界面配置:通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。 |
|
代码编辑:将交互界面中的配置转换为json格式配置,通过编辑json配置信息,完成信息抽取配置。 所支持的信息抽取函数请见信息抽取函数。 |
|||
非结构化抽取 |
基础数据格式为txt文本的自然语言短句 |
通过选择合适的算法,完成信息抽取配置。 可选择已有的预置模型模板,也可选择您自定义的模型。 |
- 在通过结构化抽取方式进行信息抽取时,交互界面配置与代码编辑配置可以相互切换。
- 信息抽取配置完成后,鼠标悬浮在信息抽取方框区域,显示清空图标,单击后可一键清空信息抽取配置。