更新时间:2024-03-01 GMT+08:00
代码编辑
操作步骤
- 在普通配置构建图谱页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧
按钮可以放大对话框。
- 在“信息抽取”对话框中,“抽取方式”选择“结构化抽取”,“编辑方式”选择“代码编辑”。
图1 信息抽取
- 选择“默认抽取”开关。
图标说明开关处于开启状态。开启后,在每个数据类别中,为每个数据字段建立同名抽取项,抽取函数为${数据字段名}。
图标说明开关处于关闭状态,需要编辑json格式代码。
- 在“信息抽取”对话框下方编辑json格式代码。
在“代码编辑”页签编辑json代码配置信息抽取时,可单击“交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。
- 单击“保存”,完成信息抽取。
示例
以一个电影实体为例,抽取信息前后的实体信息如图2所示,代码示例如下所示:
{ "ie_type": "function", "function_ie_configs": { "default_config": true, "ie_configs": { "Person": [ { "key": "identifier", "value_function": "${url}" }, { "key": "中文名", "value_function": "regexp_replace(${中文名}, '\\(\\[link\\]@.*?:(/film.*?)\\)', '')" }, { "key": "国籍", "value_function": "regexp_replace(${国籍}, '\\(\\[link\\]@.*?:(/film.*?)\\)', '')" }, { "key": "职业", "value_function": "${职业}" }, { "key": "出生日期", "value_function": "${出生日期}" }, { "key": "url", "value_function": "${url}" } ], "Film": [ { "key": "identifier", "value_function": "${url}" }, { "key": "中文名", "value_function": "${中文名}" }, { "key": "票房", "value_function": "${票房}" }, { "key": "上映时间", "value_function": "${上映时间}" }, { "key": "导演", "value_function": "regexp_extract_all(${导演}, '\\(\\[link\\]@.*?:(/film.*?)\\)', 1)" }, { "key": "主演", "value_function": "regexp_extract_all(${主演}, '\\(\\[link\\]@.*?:(/film.*?)\\)', 1)" }, { "key": "url", "value_function": "${url}" } ] } } }
后续操作
配置信息抽取后,进入创建图谱的下一步操作配置知识映射。
父主题: 结构化抽取