图引擎服务 GES图引擎服务 GES

更新时间:2021/03/18 GMT+08:00
分享

图数据的格式

在导入图数据之前,您需要了解GES中支持的图数据格式。

 • GES支持载入具有标准CSV格式的原始图数据,如果您的原始数据并不符合指定的格式,则需要将数据整理为GES支持的格式。
 • GES支持的图数据格式包含三部分:点文件、边文件以及元数据。
  • 点文件用于存放点数据。
  • 边文件用于存放边数据。
  • 元数据用于描述点文件和边文件中的数据格式。

概念说明

GES基于属性图模型导入图数据,因此,您需要了解属性图(Property graph)的基本概念。

一个属性图是由点、边、标签(Label)和属性(Property)组成的有向图。

 • 点又称作节点(Node),边又称作关系(Relationship),点和关系是最重要的实体。
 • 元数据是用于描述点或边的属性信息,元数据由多个标签组成,每个标签由一个或多个属性组成。
 • 为点或边设置标签,那么拥有相同标签的点属于一个分组,是一个集合。
 • 点和边只能设置一个标签。

如下示例中,此图数据由3个点和3条边组成,Vivian、Eric和Lethal Weapon表示点,(Vivian,Eric)、(Vivian,Lethal Weapon)和(Eric、Lethal Weapon)表示边,user和movie表示点的类型(标签),rate和friends表示关系类型(标签)。

图1 图数据格式的示例

元数据

GES的元数据用于定义点和边的属性信息,为XML格式的文件。

在元数据中包含了标签(Label)和属性(Property)。

 • 标签(Label)

  标签是属性的集合,描述了一个点或边拥有的所有属性的数据格式。

  在不同的标签中,如果定义了相同的属性名称(Property name),则定义的cardinality和dataType需要跟已定义的一致。

 • 属性(Property)

  属性指的是单个属性的数据格式,包含3个字段。

  • Property name:属性名称。长度限制为1到256位,且不能包含< > &。

   同一个标签中不能包含相同的Property name。

  • cardinality:数据的复合类型,取值为single、list和set。
   • single是单值类型,表示该属性的数据是一个单值,如一个数字或一个字符串。

    当数据文件中single属性的数值为“value1;value2”这样的值时,将被识别为单值“value1;value2”。

   • list和set是多值类型,表示该属性的数据由多个值组成,不同的值用分号分隔。
    • list:数值有放入顺序,可重复,例如,“1;1;1”表示3个“1”。
    • set:数值无放入顺序,不可重复,重复数值会覆盖掉,例如,“1;1;1”只表示1个“1”。

    list和set类型不支持char array数据类型。

  • dataType:数据类型,支持的的数据类型如下表所示。
   表1 支持的数据类型

   类型

   描述

   char

   字符。

   char array

   定长字符串(需指定最大长度)。

   说明:
   • 只有single类型支持该数据类型。
   • 如果是数据类型是字符串类型,建议设置为char array,比设置为string类型,导入速度快。

   float

   float浮点类型(32位浮点)。

   double

   double浮点类型(64位浮点)。

   bool

   bool类型,取值(0/1)或者(true/false)。

   long

   长整数类型(取值范围-2^63 to 2^63-1)。

   int

   整数类型(取值范围-2^31 to 2^31-1)。

   date

   日期,目前支持格式如下所示:

   • YYYY-MM-DD HH:MM:SS
   • YYYY-MM-DD
   说明:

   MM和DD均须写为两位数,即个位数字前加上“0”,例如“05/01”。

   enum

   枚举类型(需指定枚举类型的个数以及每个枚举值),详见图_元数据示例

   string

   不定长字符串类型。

   说明:

   由于string为不定长类型,影响数据导入效率,建议使用char array替代;

   char array的长度根据业务需要自行定义,建议不超过32个字符。

元数据的示例如下所示:

图2 元数据示例

点文件

点文件罗列了各个点的数据信息。一行为一个点的数据。格式如下所示,id是点数据的唯一标识。

id, label, property 1, property 2, property 3,…
 • 点id的名称中不能包含中划线(-)。
 • 点id的类型不需要设置,默认为string。

示例:

Vivian,user,薇薇安,F,25-34,artist,98133
Eric,user,埃里克,M,18-24,college/grad student,40205

边文件

边文件罗列了各个边的数据信息,一行为一条边的数据。GES中图规格是以边的数量进行定义的,如一百万边。格式如下所示,id 1、id 2是一条边的两个端点的id。

id 1, id 2, label, property 1, property 2, …

示例:

Eric,Lethal Weapon,rate,4,2000-11-21 15:33:18
Vivian,Eric,friends
分享:

  相关文档

  相关产品