更新时间:2024-03-01 GMT+08:00
分享

代码编辑

前提条件

操作步骤

  1. 在普通配置构建图谱页面,单击“信息抽取”,页面下方弹出“信息抽取”对话框,单击右侧按钮可以放大对话框。
  2. “信息抽取”对话框中,“抽取方式”选择“结构化抽取”“编辑方式”选择“代码编辑”
    图1 信息抽取
  3. 选择“默认抽取”开关。
    • 图标说明开关处于开启状态。开启后,在每个数据类别中,为每个数据字段建立同名抽取项,抽取函数为${数据字段名}。
    • 图标说明开关处于关闭状态,需要编辑json格式代码。
  4. “信息抽取”对话框下方编辑json格式代码。

    “代码编辑”页签编辑json代码配置信息抽取时,可单击“交互界面”,切换至“交互界面”页签,查看信息抽取前后的相关字段。

  5. 单击“保存”,完成信息抽取。

    如果创建多个数据源,请完成所有数据源的信息抽取配置。配置数据源请参见配置数据源

示例

以一个电影实体为例,抽取信息前后的实体信息如图2所示,代码示例如下所示:

图2 信息抽取
{
  "ie_type": "function",
  "function_ie_configs": {
    "default_config": true,
    "ie_configs": {
      "Person": [
        {
          "key": "identifier",
          "value_function": "${url}"
        },
        {
          "key": "中文名",
          "value_function": "regexp_replace(${中文名}, '\\(\\[link\\]@.*?:(/film.*?)\\)', '')"
        },
        {
          "key": "国籍",
          "value_function": "regexp_replace(${国籍}, '\\(\\[link\\]@.*?:(/film.*?)\\)', '')"
        },
        {
          "key": "职业",
          "value_function": "${职业}"
        },
        {
          "key": "出生日期",
          "value_function": "${出生日期}"
        },
        {
          "key": "url",
          "value_function": "${url}"
        }
      ],
      "Film": [
        {
          "key": "identifier",
          "value_function": "${url}"
        },
        {
          "key": "中文名",
          "value_function": "${中文名}"
        },
        {
          "key": "票房",
          "value_function": "${票房}"
        },
        {
          "key": "上映时间",
          "value_function": "${上映时间}"
        },
        {
          "key": "导演",
          "value_function": "regexp_extract_all(${导演}, '\\(\\[link\\]@.*?:(/film.*?)\\)', 1)"
        },
        {
          "key": "主演",
          "value_function": "regexp_extract_all(${主演}, '\\(\\[link\\]@.*?:(/film.*?)\\)', 1)"
        },
        {
          "key": "url",
          "value_function": "${url}"
        }
      ]
    }
  }
}

后续操作

配置信息抽取后,进入创建图谱的下一步操作配置知识映射

分享:

    相关文档

    相关产品