更新时间:2024-04-24 GMT+08:00
分享

什么是信息抽取

信息抽取是从基础数据中抽取待创建图谱的实体、属性信息以及实体间的相互关系。目的是从原始数据(包括结构化数据或非结构化数据)中抽取结构化的信息。

配置方式

信息抽取分为结构化抽取和非结构化抽取,其适用范围和抽取方式如表1所示。

表1 配置方式说明

配置方式

适用范围

具体方式

操作指引

结构化抽取

基础数据格式为xlsx、csv、json格式

交互界面配置:通过输入实体类型、抽取函数及抽取前后的数据字段,完成信息抽取配置。

所支持的信息抽取函数请见信息抽取函数

交互界面配置

代码编辑:将交互界面中的配置转换为json格式配置,通过编辑json配置信息,完成信息抽取配置。

所支持的信息抽取函数请见信息抽取函数

代码编辑

非结构化抽取

基础数据格式为txt文本的自然语言短句

通过选择合适的算法,完成信息抽取配置。

可选择已有的预置模型模板,也可选择您自定义的模型。

非结构化抽取

  • 在通过结构化抽取方式进行信息抽取时,交互界面配置与代码编辑配置可以相互切换。
  • 信息抽取配置完成后,鼠标悬浮在信息抽取方框区域,显示清空图标,单击后可一键清空信息抽取配置。

相关文档