更新时间:2025-11-20 GMT+08:00
分享

GBase数据源

GBase数据库是一款国产高性能、高可靠、高安全的分布式分析型数据库,广泛应用于大数据分析与实时决策支持场景。

本数据集成服务支持GBase数据库,提供读写数据迁移能力。

使用前准备及限制

  • 网络要求

    GBase数据源必须与CDM网络进行通讯,以确保数据传输的顺畅性。详情请参见网络打通

  • 权限要求
    • 读取GBase:账号需具备对同步表的只读权限(SELECT),以确保数据能够被安全、准确地读取。
    • 写入GBase:账号需具备对同步表的写入权限(INSERT、DELETE、UPDATE,CREATE),以便能够将数据正确写入目标表。

驱动选择

驱动名称

获取地址

建议版本

com.gbase.jdbc.Driver

驱动下载

8.3.81.53版本

支持的数据类型

本数据集成服务支持GBase文件多格式解析。

类型分类

字段类型

GBase读取

GBase写入

整数型

TINYINT

SMALLINT

MEDIUMINT

INT

BIGINT

浮点数

FLOAT

DOUBLE

DECIMAL

字符型

CHAR

VARCHAR

TINYTEXT

TEXT

MEDIUMTEXT

LONGTEXT

布尔

BOOLEAN

时间

DATE

DATETIME

TIMESTAMP

TIME

支持的迁移场景

数据集成离线同步支持以下三种同步方式,以满足不同数据迁移场景的需求:

需要注意的是,分库分表与整库迁移能力会根据不同region的上线支持情况有所不同,具体支持情况以页面为准。以下是针对GBase的支持迁移场景概览:

支持迁移场景

单表读取

单表写入

分库分表读取

分库分表写入

整库读取

整库写入

是否支持

x

x

x

核心能力速览

  • 连接配置

    配置项

    支持情况

    说明

    用户/AK

    支持用户认证,确保连接安全。

    SSL加密认证

    x

    支持SSL加密,保障数据传输安全,当前暂不支持。

    连接配置调优

    支持connectTimeout等连接配置调优,可根据实际需求优化连接性能。

    自定义驱动

    支持自定义驱动,提供更高的灵活性。

  • 读取能力

    配置项

    支持情况

    说明

    增量读取

    支持where条件和SQL模式,可实现增量读取。

    分片并发

    支持按主键或常见字段做水平分片,多线程并行抽取,显著提升吞吐效率。

    脏数据处理

    支持异常数据写入脏数据桶,避免因少量异常数据导致作业失败。

    自定义字段

    可在任务级追加计算列、常量列或脱敏函数,满足个性化业务需求。

  • 写入能力

    配置项

    支持情况

    说明

    脏数据处理

    支持异常数据写入脏数据桶,避免因少量异常数据导致作业失败。

    导入前后处理

    支持preSql/delete等操作,可在数据导入前后进行数据清洗和处理。

    并发写入

    支持并发写入,提升写入效率。

    写入行数调优

    支持在连接中配置【单次提交行数】和【单次写入行数】参数调优,可根据实际需求优化写入性能。

创建数据源

DataArts Studio管理中心新建相应的数据源,详情请参见创建DataArts Studio数据连接

创建数据集成离线作业

DataArts Studio数据开发中新建GBase集成作业,详情请参见新建离线处理集成作业

相关文档