非结构化抽取
前提条件
- 如果选择使用自己自定义模型,您需要在创建知识图谱之前,自定义用于信息抽取的模型,具体操作请见自定义信息抽取模型。
操作步骤
- 在图谱流水线配置页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。
图1 流水线配置页面
- 在“信息抽取”对话框中,“抽取方式”默认为“非结构化抽取”。
- 根据自身业务需要,您可以选择“公有库模型”、“预置模型”或者“用户自定义模型”,三者仅需选择一项。
“公有库模型”:当前提供“SimpleBertModel”和“RelationExtraction”两种公有库模型。
“预置模型”:当前提供“RESBM”和“RelationExtraction”两种预置模型。
“用户自定义模型”:您需提前在控制台自定义模型,详情请参见自定义信息抽取模型。
- 可在下方查看从文本信息中抽取的知识类型,知识类型包括主语“Subject_type”、谓语“Predicate”、宾语“Object_type”,即可查看到可抽取的主语、谓语、宾语组合。
图2 抽取模型
- 单击“保存”,完成信息抽取。
如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源。
后续操作
配置信息抽取后,进入创建图谱的下一步操作配置知识映射。