计算
弹性云服务器 ECS
Flexus云服务
裸金属服务器 BMS
弹性伸缩 AS
镜像服务 IMS
专属主机 DeH
函数工作流 FunctionGraph
云手机服务器 CPH
Huawei Cloud EulerOS
网络
虚拟私有云 VPC
弹性公网IP EIP
虚拟专用网络 VPN
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
VPC终端节点 VPCEP
云连接 CC
企业路由器 ER
企业交换机 ESW
全球加速 GA
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
边缘安全 EdgeSec
威胁检测服务 MTD
CDN与智能边缘
内容分发网络 CDN
CloudPond云服务
智能边缘云 IEC
迁移
主机迁移服务 SMS
对象存储迁移服务 OMS
云数据迁移 CDM
迁移中心 MGC
大数据
MapReduce服务 MRS
数据湖探索 DLI
表格存储服务 CloudTable
云搜索服务 CSS
数据接入服务 DIS
数据仓库服务 GaussDB(DWS)
数据治理中心 DataArts Studio
数据可视化 DLV
数据湖工厂 DLF
湖仓构建 LakeFormation
企业应用
云桌面 Workspace
应用与数据集成平台 ROMA Connect
云解析服务 DNS
专属云
专属计算集群 DCC
IoT物联网
IoT物联网
设备接入 IoTDA
智能边缘平台 IEF
用户服务
账号中心
费用中心
成本中心
资源中心
企业管理
工单管理
国际站常见问题
ICP备案
我的凭证
支持计划
客户运营能力
合作伙伴支持计划
专业服务
区块链
区块链服务 BCS
Web3节点引擎服务 NES
解决方案
SAP
高性能计算 HPC
视频
视频直播 Live
视频点播 VOD
媒体处理 MPC
实时音视频 SparkRTC
数字内容生产线 MetaStudio
存储
对象存储服务 OBS
云硬盘 EVS
云备份 CBR
存储容灾服务 SDRS
高性能弹性文件服务 SFS Turbo
弹性文件服务 SFS
云硬盘备份 VBS
云服务器备份 CSBS
数据快递服务 DES
专属分布式存储服务 DSS
容器
云容器引擎 CCE
容器镜像服务 SWR
应用服务网格 ASM
华为云UCS
云容器实例 CCI
管理与监管
云监控服务 CES
统一身份认证服务 IAM
资源编排服务 RFS
云审计服务 CTS
标签管理服务 TMS
云日志服务 LTS
配置审计 Config
资源访问管理 RAM
消息通知服务 SMN
应用运维管理 AOM
应用性能管理 APM
组织 Organizations
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
应用身份管理服务 OneAccess
数据库
云数据库 RDS
文档数据库服务 DDS
数据管理服务 DAS
数据复制服务 DRS
云数据库 GeminiDB
云数据库 GaussDB
分布式数据库中间件 DDM
数据库和应用迁移 UGO
云数据库 TaurusDB
人工智能
人脸识别服务 FRS
图引擎服务 GES
图像识别 Image
内容审核 Moderation
文字识别 OCR
AI开发平台ModelArts
图像搜索 ImageSearch
对话机器人服务 CBS
华为HiLens
视频智能分析服务 VIAS
语音交互服务 SIS
应用中间件
分布式缓存服务 DCS
API网关 APIG
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
多活高可用服务 MAS
事件网格 EG
企业协同
华为云会议 Meeting
云通信
消息&短信 MSGSMS
云生态
合作伙伴中心
云商店
开发者工具
SDK开发指南
API签名指南
Terraform
华为云命令行工具服务 KooCLI
其他
产品价格详情
系统权限
管理控制台
客户关联华为云合作伙伴须知
消息中心
公共问题
开发与运维
应用管理与运维平台 ServiceStage
软件开发生产线 CodeArts
需求管理 CodeArts Req
部署 CodeArts Deploy
性能测试 CodeArts PerfTest
编译构建 CodeArts Build
流水线 CodeArts Pipeline
制品仓库 CodeArts Artifact
测试计划 CodeArts TestPlan
代码检查 CodeArts Check
代码托管 CodeArts Repo
云应用引擎 CAE
开天aPaaS
云消息服务 KooMessage
云手机服务 KooPhone
云空间服务 KooDrive
文档首页/ 数据仓库服务 GaussDB(DWS)/ 最佳实践/ 数据迁移/ 使用DRS实时同步MySQL表数据至GaussDB(DWS)集群

使用DRS实时同步MySQL表数据至GaussDB(DWS)集群

更新时间:2024-10-10 GMT+08:00

本实践演示通过华为云数据复制服务(Data Replication Service,简称DRS)完成MySQL数据实时同步到GaussDB(DWS)的基本过程。了解DRS服务,请参见什么是数据复制服务

本实践预计时长60分钟,基本流程如下:

  1. 准备工作
  2. 步骤一:准备MySQL源表数据
  3. 步骤二:创建DWS集群
  4. 步骤三:创建DRS同步任务
  5. 步骤四:验证数据同步

场景描述

大数据分析场景下,MySQL作为OLTP数据库,接入GaussDB(DWS)数仓进行OLAP业务分析后,对于MySQL实时写入的数据也需要实时同步入仓,此时可通过DRS实现。

图1 DRS实时同步MySQL

准备工作

  • 已注册华为账号并开通华为云,且在使用GaussDB(DWS) 前检查账号状态,账号不能处于欠费或冻结状态。
  • 已准备待迁移的MySQL源表数据,本实验使用华为云数据库RDS的MySQL数据库作为源数据举例,如源数据为MySQL线下版本,请确保网络连通。

步骤一:准备MySQL源表数据

  1. 已购买云数据库RDS的MySQL引擎(本实践以MySQL 8.0.x为例),参见购买RDS实例
  2. 已创建源数据库rds_demo,字符集utf8mb4,且库中已存在表rds_t1和数据。

步骤二:创建DWS集群

  1. 创建集群,为确保网络连通,GaussDB(DWS) 集群与RDS在同一个区域下。
  2. 在GaussDB(DWS)控制台的“专属集群 > 集群列表”页面,单击指定集群所在行操作列“登录”按钮。

    说明:

    本实践以8.1.3.x版本为例,8.1.2及以前版本不支持此登录方式,可以使用Data Studio连接集群

  3. 登录GaussDB(DWS)数据库后,创建待同步MySQL数据的数据库:rds_demo。

    1
    CREATE DATABASE rds_demo WITH ENCODING 'UTF-8' DBCOMPATIBILITY 'mysql' TEMPLATE template0;
    

  4. 切换到rds_demo数据库,创建名称为rds_demo的Schema。

    1
    CREATE SCHEMA rds_demo;
    

  5. 在rds_demo的Schema下创建表rds_t1。

     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    CREATE TABLE rds_demo.rds_t1 (
      area_id varchar(256) NOT NULL,
      area_name varchar(256) DEFAULT NULL,
      lifecycle varchar(256) DEFAULT NULL,
      user_num int DEFAULT NULL,
      income  bigint DEFAULT NULL,
      create_time timestamp DEFAULT CURRENT_TIMESTAMP,
       PRIMARY KEY (area_id)
    )distribute by hash(area_id);
     COMMENT on column rds_demo.rds_t1.area_id is '区域编码';
     COMMENT on column rds_demo.rds_t1.area_name is '区域名称';
     COMMENT on column rds_demo.rds_t1.lifecycle is '生命周期';
     COMMENT on column rds_demo.rds_t1.user_num is '各个生命周期用户数';
     COMMENT on column rds_demo.rds_t1.income is '区域总收入';
     COMMENT on column rds_demo.rds_t1.create_time is '创建时间';
    

  6. 查询表数据,目前为空表。

    1
    SELECT * FROM rds_demo.rds_t1;
    

步骤三:创建DRS同步任务

  1. 选择“服务列表 > 数据库 > 数据复制服务 DRS”,切换至DRS控制台。

  2. 在左侧导航栏选择“实时同步管理”,单击右上角的“创建同步任务”。

  3. 填写基本参数,参见表1

    表1 基本参数

    参数名称

    取值

    计费模式

    按需计费

    区域

    中国-香港,确保RDS与DWS所选区域为同一个区域。

    项目

    中国-香港

    任务名称

    DRS-DWS

    描述

    -

  4. 继续填写以下参数,参见表2

    表2 同步实例信息

    参数名称

    取值

    数据流动方向

    入云

    源数据引擎

    MySQL

    目标数据库引擎

    GaussDB(DWS)

    网络类型

    本实践选择“VPC网络”,如果MySQL为线下版本,则需要选择“公网网络”。

    实例类型

    单机

    目标数据库实例

    选择步骤二:创建DWS集群的集群名称。

    同步实例所在子网

    选择DWS集群所在子网。本实践RDS、DWS都在同一个VPC和子网下。

    同步模式

    全量+增量。

    规格类型

    本实践选择“极小”,实际请按数据量和同步速率要求进行评估。

  5. 单击“下一步”,确认无误后单击“我已阅读并知晓”。

    等待实例同步,大约5~10分钟。

  6. 实例同步成功后,填写源库信息,单击“测试连接”,显示测试连接成功即可。

    表3 源库信息

    参数项

    取值

    数据库类型

    RDS实例

    数据库实例名称

    选择创建的RDS实例。

    数据库用户名

    root

    数据库密码

    ****

  7. 填写目标库信息,单击“测试连接”,显示测试连接成功即可。

    表4 目标库信息

    参数项

    取值

    数据库用户名

    dbadmin

    数据库密码

    ****

  8. 单击“下一步”,确认无误后单击“同意,并继续”。
  9. 设置同步策略,参见表5

    表5 同步策略

    参数项

    取值

    流速模式

    不限速

    同步对象类型

    同步数据

    增量阶段冲突策略

    覆盖

    数据同步拓扑

    一对一

    增量支持DDL

    默认值

    同步对象

    表级同步。

    从源数据库中勾选要同步的表,本实践为rds_demo下的rds_t1。

    并填写同步到DWS的数据库名:rds_demo

  10. 单击“下一步”,确认无误,再单击“下一步”。

    等待数据库参数检查成功,如果不成功,单击“重新校验”。

  11. 单击“下一步”,启动时间选择“立即启动”,其他信息核对无误,单击右下角“启动任务”。

  12. 弹出窗口确认无误后勾选“我已阅读启动前须知”,并单击“启动任务”。

    回到DRS的“实时同步管理”页面,等待约5~10分钟,启动成功。

    启动成功后,数据开始同步,等待约5分钟,继续执行步骤四:验证数据同步

步骤四:验证数据同步

  1. 回到GaussDB(DWS)管理控制台,重新登录DWS,执行以下语句再次查询表数据,显示结果如下图所示表示全量数据同步成功。

    1
    SELECT * FROM rds_demo.rds_t1;
    

  2. 切换到RDS管理控制台,登录RDS数据库,向表rds_t1插入新的数据。

    1
    INSERT INTO rds_t1 VALUES ('5','new_area_name_05',34,64,1003,'2022-11-04');
    

  3. 切回DWS数据库,执行以下语句查询表数据。

    查询结果中新增一条行数据,表示MySQL的更新数据已实时同步到GaussDB(DWS)。
    1
    SELECT * FROM rds_demo.rds_t1;
    

我们使用cookie来确保您的高速浏览体验。继续浏览本站,即表示您同意我们使用cookie。 详情

文档反馈

文档反馈

意见反馈

0/500

标记内容

同时提交标记内容