更新时间:2024-11-29 GMT+08:00

GraphBase关键特性

GraphBase关键特性:支持多图

场景描述

  • 不同业务部门开发不同的应用,可以共用同一套图数据库
  • 不同的应用,采用不同的数据,数据无关联,方便业务隔离

多图方案设计图

  • GraphServer:包含GremlinServer和StandardServer服务,GremlinServer负责gremlin图查询服务,StandardServer负责REST服务等;系统启动时,meta_graph图先启动,meta_graph图负责存储多图元数据、异步任务等;ZooKeeper负责监控服务中活着的实例,并提供分布式锁服务。
  • LoadBalancer:提供图服务的负荷分担能力。
  • GraphWriter:数据批量导入模块。
  • GraphStreaming:数据实时导入模块。

GraphBase关键特性:数据导入

支持批量导入和实时导入

GraphBase支持批量导入和实时导入两种形式,批量导入利用Spark将存储在HDFS上的历史数据全量导入到图数据库,实时导入利用Kafka和SparkStreaming将数据实时的导入到图数据库。

支持灵活的数据映射规则,将原始数据方便的映射成图模型。

批量导入支持BulkLoad

新增预计BulkLoad模式的导入能力,支持更快速的数据导入。

数据导入时,可以在一次MapReduce任务中同步生成Graph HFiles和Inner Secondary Index HFiles。