GBase数据源
GBase数据库是一款国产高性能、高可靠、高安全的分布式分析型数据库,广泛应用于大数据分析与实时决策支持场景。
本数据集成服务支持GBase数据库,提供读写数据迁移能力。
使用前准备及限制
- 网络要求
GBase数据源必须与CDM网络进行通讯,以确保数据传输的顺畅性。详情请参见网络打通。
- 权限要求
- 读取GBase:账号需具备对同步表的只读权限(SELECT),以确保数据能够被安全、准确地读取。
- 写入GBase:账号需具备对同步表的写入权限(INSERT、DELETE、UPDATE,CREATE),以便能够将数据正确写入目标表。
驱动选择
|
驱动名称 |
获取地址 |
建议版本 |
|---|---|---|
|
com.gbase.jdbc.Driver |
8.3.81.53版本 |
支持的数据类型
|
类型分类 |
字段类型 |
GBase读取 |
GBase写入 |
|---|---|---|---|
|
整数型 |
TINYINT |
√ |
√ |
|
SMALLINT |
√ |
√ |
|
|
MEDIUMINT |
√ |
√ |
|
|
INT |
√ |
√ |
|
|
BIGINT |
√ |
√ |
|
|
浮点数 |
FLOAT |
√ |
√ |
|
DOUBLE |
√ |
√ |
|
|
DECIMAL |
√ |
√ |
|
|
字符型 |
CHAR |
√ |
√ |
|
VARCHAR |
√ |
√ |
|
|
TINYTEXT |
√ |
√ |
|
|
TEXT |
√ |
√ |
|
|
MEDIUMTEXT |
√ |
√ |
|
|
LONGTEXT |
√ |
√ |
|
|
布尔 |
BOOLEAN |
√ |
√ |
|
时间 |
DATE |
√ |
√ |
|
DATETIME |
√ |
√ |
|
|
TIMESTAMP |
√ |
√ |
|
|
TIME |
√ |
√ |
支持的迁移场景
数据集成离线同步支持以下三种同步方式,以满足不同数据迁移场景的需求:
- 单表同步
适用于数据入湖和数据上云场景下,表或文件级别的数据同步。支持的数据源类型请参考单表支持的数据源类型。
- 分库分表同步
适用于数据入湖和数据上云场景下,多库多表同步场景。支持的数据源类型请参考分库分表同步支持的数据源类型。
- 整库迁移
适用于数据入湖和数据上云场景下,离线或自建数据库整体同步场景。支持的数据源类型请参考整库同步支持的数据源类型。
需要注意的是,分库分表与整库迁移能力会根据不同region的上线支持情况有所不同,具体支持情况以页面为准。以下是针对GBase的支持迁移场景概览:
|
支持迁移场景 |
单表读取 |
单表写入 |
分库分表读取 |
分库分表写入 |
整库读取 |
整库写入 |
|---|---|---|---|---|---|---|
|
是否支持 |
√ |
√ |
x |
√ |
x |
x |
核心能力速览
- 连接配置
配置项
支持情况
说明
用户/AK
√
支持用户认证,确保连接安全。
SSL加密认证
x
支持SSL加密,保障数据传输安全,当前暂不支持。
连接配置调优
√
支持connectTimeout等连接配置调优,可根据实际需求优化连接性能。
自定义驱动
√
支持自定义驱动,提供更高的灵活性。
- 读取能力
配置项
支持情况
说明
增量读取
√
支持where条件和SQL模式,可实现增量读取。
分片并发
√
支持按主键或常见字段做水平分片,多线程并行抽取,显著提升吞吐效率。
脏数据处理
√
支持异常数据写入脏数据桶,避免因少量异常数据导致作业失败。
自定义字段
√
可在任务级追加计算列、常量列或脱敏函数,满足个性化业务需求。
- 写入能力
配置项
支持情况
说明
脏数据处理
√
支持异常数据写入脏数据桶,避免因少量异常数据导致作业失败。
导入前后处理
√
支持preSql/delete等操作,可在数据导入前后进行数据清洗和处理。
并发写入
√
支持并发写入,提升写入效率。
写入行数调优
√
支持在连接中配置【单次提交行数】和【单次写入行数】参数调优,可根据实际需求优化写入性能。
创建数据源
在DataArts Studio管理中心新建相应的数据源,详情请参见创建DataArts Studio数据连接。
创建数据集成离线作业
在DataArts Studio数据开发中新建GBase集成作业,详情请参见新建离线处理集成作业。