文档首页/ 知识图谱 KG/ 常见问题/ 管理图谱/ 如何全量更新图谱
更新时间:2023-06-14 GMT+08:00
分享

如何全量更新图谱

针对已经创建的知识图谱,您可以全量更新图谱,即使用新的数据源更新知识图谱。

当图谱版本数量达到上限时,无法全量更新图谱。

前提条件

  • 在全量更新知识图谱之前,如果您选择通过流水线配置构建新图谱,您需要提前创建用于组织新图谱信息结构的本体,方式如下:
  • 待更新的图谱“运行状态”处于“可用”状态。

进入全量更新页面

  1. 登录KG服务管理控制台,默认进入“我的图谱”页面。
  2. “我的图谱”页面,单击图谱卡片。

    进入图谱详情页面。

  3. 单击右上角的“全量更新”,根据自身业务选择更新方式,可选“普通配置构建”“智能一键构建”“图谱导入”

    普通配置构建:通过配置数据源、配置图谱本体、配置信息抽取、配置知识映射、知识融合、图谱质检等流水线步骤,构建新的知识图谱。

    智能一键构建:只需提供新的源数据,无需创建本体等其他配置,快速构建新的知识图谱。

    图谱导入:对于导出的图谱版本,通过图谱导入可以快速恢复图谱版本。

普通配置构建新图谱

在页面右上角单击“全量更新 > 普通配置构建”,依次完成数据源配置、图谱本体选择、信息抽取、知识映射、知识融合、图谱质检的配置,详细的操作指引请见表1
图1 普通配置构建

“全量更新”页面入口与“创建知识图谱”页面入口不同,但是全量更新中的配置操作均与创建知识图谱操作相同。

表1 全量更新图谱操作

操作顺序

操作名称

操作指引

1

更新基础数据

配置数据源

2

更新图谱本体

配置图谱本体

3

更新信息抽取

配置信息抽取

4

更新知识映射

配置知识映射

5

更新知识融合

配置知识融合

6

更新图谱质检

配置图谱质检

配置完后,单击右上角的“生成图谱”

跳至“我的图谱”页面,等待“运行状态”变为“可用”,即图谱构建完成。您可以单击已构建的图谱卡片,进入图谱详情页面查看图谱详情。

智能一键构建新图谱

  1. 在页面右上角单击“全量更新 > 智能一键构建”,按表2填写信息。
    图2 智能一键构建
    表2 智能一键构建图谱

    参数

    说明

    图谱名称

    待创建图谱的名称。在选择图谱规格时已确定,无法更改。

    选择数据格式

    构建图谱的数据源格式,包括“CSV”“XLSX”“JSON”,详情请见数据格式要求

    选择数据源文件

    选择数据源存放在OBS的路径。

    单击,弹出“选择数据源文件”对话框,填写如下信息,然后单击“确定”

    • “OBS桶”:选择数据源文件存放的OBS桶。
    • “存储路径”:选择数据源文件存放在OBS桶的文件路径。
      说明:
      • 数据源存储的OBS路径不允许使用加密的OBS路径。
      • 由于当前KG服务部署在“华北-北京四”,您在创建OBS桶时,需保证您的OBS桶与KG服务在同一区域,桶的存储类别为“标准存储”。

    实体类型字段

    数据中标识该实体属于何种类型的字段。

    当数据源的数据格式为“JSON”时,需要填写该字段。

  2. 单击“下一步”

    自动生成本体结构,您也可以进行修改。

  3. 单击“下一步”

    进入流水线配置页面。

  4. 单击“运行”

    跳至图谱详情页面,等待“运行状态”变为“可用”,即图谱构建完成。

图谱导入

  1. 在页面右上角单击“全量更新 > 图谱导入”
  2. 在图谱导入对话框中,选择待导入图谱所在的“OBS桶”和“存储路径”。所选的OBS桶需保证与KG服务在同一区域,桶的存储类别为“标准存储”;所选的存储路径中需包含csv文件夹、ontology.json文件、pipeline_config.json文件。
    图3 图谱导入
  3. 单击“确定”,进入流水线配置页面。

后续操作

全量更新图谱后,如果存在被融合的实体,就需要进行融合验证,详情请见融合验证

全量更新图谱后,您可以发布图谱版本。只有发布图谱版本后,才能查询图谱中的实体数据。

相关文档