更新时间:2022-02-22 GMT+08:00

如何查询和分析图

本章节介绍如何使用图引擎服务(GES)对示例图数据进行查询和分析。查询和分析图具体流程如下所示:

步骤1:创建图

步骤2:访问图

步骤3:查询和分析图

步骤4:查看分析结果

步骤1:创建图

进入图引擎服务管理控制台,单击“创建图”,进入创建图页面。

具体创建步骤如下:

  1. 在创建图页面,填写以下内容:

    1. “服务选型”页面设置图名称和软件版本。
      • 填写“图名称”。例如,demo,或采用系统默认名称。

        图名称的长度需满足如下条件:

        • 4~50个字符,且必须以字母开头。
        • 字母不区分大小写。
        • 只能包含字母、数字或下划线,不能包含其他特殊字符。
      • 选择“GES软件版本”:系统默认当前最新版本。
        • 目前只能选择当前默认的版本号。
        • 图创建后,不支持修改图名称。
    2. 选择网络信息,包含“虚拟私有云”“子网”“安全组”“公网访问”
      1. “虚拟私有云”:VPC即虚拟私有云,是通过逻辑方式进行网络隔离,提供安全、隔离的网络环境。

        选择需要创建集群的VPC,单击“查看虚拟私有云”,可进入VPC服务查看已创建的VPC名称和ID。

        若您的账号下有vpc,则自动选择一个填充,您可自行更改;若无vpc,则需要创建一个新的vpc,创建成功后,可自动填充。

      2. “子网”:通过子网提供与其他网络隔离的、可以独享的网络资源,以提高网络安全。

        选择需要创建集群的子网,可进入VPC服务查看VPC下已创建的子网名称和ID。

      3. “安全组”:安全组是一个逻辑上的分组,为同一个VPC内具有相同安全保护需求并相互信任的弹性云服务器提供访问策略。
        • 单击“查看安全组”可了解安全组详情。
      4. 选择公网访问的方式,包含“暂不使用”“现在购买”“使用已有”,用户可根据自身需求选择。
        • “暂不使用”:不使用弹性IP的图实例并且不能与互联网互通,仅可通过私有网络中已部署的弹性云服务器连接当前图实例使用。
        • “现在购买”:服务将自动为图实例分配独享带宽的弹性IP,以支持通过弹性IP从互联网对图实例进行访问。同时,服务将使用租户权限在当前项目下自动创建以ges_agency_default为前缀的授权委托以支持弹性IP的绑定处理。
        • “使用已有”:为图实例绑定指定的弹性IP,通过弹性IP可以从互联网对图实例进行访问。
    3. 填写图相关参数。
      1. 是否支持跨AZ高可用:该选项表示是否支持跨可用区部署集群。开启该选项,图实例分布在不同可用区(AZ)增强可靠性。
      2. 用途:“企业生产”“开发学习”
        • “企业生产”:支持高可靠,高并发,适合企业生产及大规模应用时使用。
        • “开发学习”:完整功能体验,适合开发者学习使用。
      3. CPU架构:目前支持“X86计算”和“鲲鹏计算”架构。

        如果底层支持X86架构,那么就可以看到并创建X86架构的集群。ARM架构逻辑同X86。如果两种架构都支持,那么都能看到并且支持创建。

      4. 图规格(边数):以边为单位,根据用户当前的配额,系统会提示可创建的图的数量以及边数。“企业生产”“开发学习”有不同的规格。
        • “企业生产”:目前可选择“一百万边”、“一千万边”、“一亿边”,“十亿边”,“一百亿边”五种规格。
        • “开发学习”:目前只有“一万边”一种规格。
      5. 是否有初始数据:该选项默认关闭,您可以创建图后再导入数据。若打开该选项,则需填写下列参数。
        • “元数据”:图的元数据信息。

          如果没有元数据,可单击“创建新的元数据”创建,创建元数据的操作指导请参考元数据管理

          如果已有元数据文件,您可以选择将元数据文件导入。

        • “边数据集”:组成此图的边数据描述,包括所有描述边的结构、标签和属性的信息。
        • “点数据集”:组成此图的点的数据描述,包括所有描述点的ID、标签和属性的信息。如果未选择,则以边数据集中的点作为点数据集来源。
        • 边数据集和点数据集当前仅支持英文路径和文件夹格式。
        • 目前只支持从OBS中选择边数据集和点数据集,建议您提前将数据文件存储至OBS中。
        • 所选边数据文件或点数据文件中的“Label”“Label”“Property”的顺序需与所选元数据文件中的一致,否则会提示“所选边数据/点数据文件与元数据文件不匹配”而无法创建图。关于GES图数据的格式的具体内容可参考图数据的格式
        • 图数据(包含元数据、边数据集、点数据集)需按照模板中的格式导入。模板中已包含一份电影数据,可单击“下载模板”后直接导入。
        • “日志存储路径”:用于存储导入图过程中不符合元数据定义的点、边数据集和详细日志。
        • “边处理”:包括“允许重复边”“忽略之后的重复边”“覆盖之前的重复边”“重复边忽略Label”

          重复边默认起点和终点相同,当考虑label时,表示边的起点、终点、label相同才为重复边。

          “允许重复边”:表示起点到终点之间可以有多条边。

          “忽略之后的重复边”:表示起点和终点之间有多条边时,仅保留最先读入的那条边。

          “覆盖之前的重复边”:表示起点和终点之间有多条边时,仅保留最后读入的那条边。

          “重复边忽略Label”:忽略label时,表示边的起点、终点相同即为重复边。

    4. “高级配置”“默认配置”“自定义”
      • “默认配置”:选择系统设定的默认值。
      • “自定义”:包括“加密图实例”“操作审计”“启用细粒度权限控制”

        “加密图实例”:是否对图实例进行加密。“密钥源”默认为“KMS”“密钥名称”用于选择对应的密钥。

        KMS密钥的禁用或删除会影响实例的功能。

        “操作审计”:是否开启操作审计。

        “启用细粒度权限控制”:开启后可对特定Label的特定属性设置遍历(traverse)、读、写权限。

  2. 单击“确认创建”。进入“规格确认”页面。
  3. 在“规格确认”页面,确认信息无误后,单击“提交”开始创建图。
  4. 提交成功后系统将自动跳转到“完成”页面,单击“返回任务中心”可查看所创建图的状态及运行结果。

步骤2:访问图

  1. “图管理”页面,在需访问的图,例如上述创建的demo,对应的“操作”列中单击“访问”
  2. 进入图编辑器页面,您可以在此页面对当前图进行查询分析。具体操作请参考步骤3:查询和分析图

步骤3:查询和分析图

  1. 可通过以下方式查询分析图:
    • 通过Gremlin命令查询
      1. 在页面下方的Gremlin输入框中,输入查询命令,如g.V().limit(100)。

        为了避免返回数据过大导致系统查询耗时过长,强烈建议您添加limit参数,并且将limit参数设置在1000以内,展示效果更佳。

      2. “回车”执行输入的Gremlin命令。查询结果分别在绘图区和结果区显示。

    • 通过Cypher命令查询
      1. 在页面下方的Cypher输入框中,输入查询命令,如match (n) return n limit 100 。
        • 第一次使用Cypher查询,您需要单击结果展示区右上角的“建索引”(后续使用不用进行此操作)。
        • match (n) return n limit 100 表示查询100个节点的详细数据。
      2. “回车”执行输入的Cypher命令,查询结果分别在绘图区和结果区显示。
    • 通过选取算法、配置参数分析
      1. 在图编辑器页面左侧,展示当前系统支持的算法列表。从中选取需要分析的算法。
      2. 选中需要使用的算法,展开算法参数配置,根据提示范围输入对应的取值。以PageRank算法为例,“alpha”为权重系数,取值“0.85”“covergence”为收敛系数,取值“0.00001”“max_iterations”为最大迭代次数,取值“1000”“directed”为是否考虑边的方向,默认为“true”
      3. 执行算法。分析结果分别在绘图区和结果区显示。

步骤4:查看分析结果

您可以在结果展示区查看“运行记录”“查询结果”