更新时间:2024-03-01 GMT+08:00
分享

非结构化抽取

前提条件

  • 如果选择使用自己自定义模型,您需要在创建知识图谱之前,自定义用于信息抽取的模型,具体操作请见自定义信息抽取模型

操作步骤

  1. 在图谱流水线配置页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。
    图1 流水线配置页面
  2. “信息抽取”对话框中,“抽取方式”默认为“非结构化抽取”
  3. 根据自身业务需要,您可以选择“公有库模型”“预置模型”或者“用户自定义模型”,三者仅需选择一项。

    “公有库模型”:当前提供“SimpleBertModel”“RelationExtraction”两种公有库模型。

    “预置模型”:当前提供“RESBM”“RelationExtraction”两种预置模型。

    “用户自定义模型”:您需提前在控制台自定义模型,详情请参见自定义信息抽取模型

  4. 可在下方查看从文本信息中抽取的知识类型,知识类型包括主语“Subject_type”、谓语“Predicate”、宾语“Object_type”,即可查看到可抽取的主语、谓语、宾语组合。
    图2 抽取模型
  5. 单击“保存”,完成信息抽取。

    如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源

后续操作

配置信息抽取后,进入创建图谱的下一步操作配置知识映射

相关文档