更新时间:2026-04-30 GMT+08:00
使用CDM导入数据
在企业数字化转型过程中,用户经常需要将存储在传统关系型数据库(如Oracle)中的业务数据,或存储在对象存储(OBS)中的日志/归档数据,同步到OpenSearch以实现高性能的全文检索与分析。面对海量异构数据,手动编写脚本不仅开发成本高,还面临网络连通性复杂、传输效率低等挑战。云数据迁移服务 (CDM) 提供了一种无需编码、向导式的解决方案,支持高并发、断点续传,能够帮助您快速安全地将Oracle或OBS中的数据“搬运”至CSS服务的OpenSearch集群。
| 数据导入场景 | 源数据 | 目标集群 |
|---|---|---|
| 将Oracle数据库的数据导入到CSS服务 | 本地或第三方Oracle数据库 | OpenSearch 1.3.6版本 |
| 将OBS的数据导入到CSS服务 | OBS桶中的JSON/CSV数据 | OpenSearch 1.3.6版本 |
准备工作
- 网络连通。
- CDM集群与CSS集群、OBS桶部署在同一VPC下,以保证内网互通,速度最快。
- 如果源端是本地Oracle,需要通过VPN/专线或公网IP确保CDM能访问到Oracle。
- 获取连接信息。
- 需要获取CSS集群的内网访问地址(如“192.168.xxx.xxx:9200”)、用户名和密码(仅安全模式的集群涉及)。
- 当源数据是Oracle数据库时,需要获取Oracle数据库的IP、端口、数据库名、用户名和密码。
- 当源数据是OBS时,需要获取OBS的桶名称、访问域名、端口、AK和SK。
导入数据
- 登录OpenSearch Dashboards进入命令执行页面。
- 登录云搜索服务管理控制台。
- 在左侧导航栏,选择“集群管理 > OpenSearch”。
- 在集群列表,选择目标集群,单击操作列的“Dashboards”,登录OpenSearch Dashboards。
- 在OpenSearch Dashboards左侧导航栏选择“Dev Tools”,进入操作页面。
控制台左侧是命令输入框,其右侧的三角形图标为执行按钮,右侧区域则显示执行结果。
- (可选)在OpenSearch集群创建目标索引。CDM支持自动创建索引,但为了获得更好的查询性能,建议先在OpenSearch集群中定义好索引结构(Mappings)。
PUT /demo { "settings": { "number_of_shards": 1 }, "mappings": { "properties": { "productName": { "type": "text", "analyzer": "ik_smart" }, "size": { "type": "keyword" } } } }执行成功后显示如下:
{ "acknowledged" : true, "shards_acknowledged" : true, "index" : "demo" } - 通过CDM服务将Oracle或OBS的数据导入OpenSearch集群。
- 当源数据是Oracle数据库时,操作指导请参见Oracle数据迁移到云搜索服务。
- 当源数据是OBS时,操作指导请参见OBS数据迁移到云搜索服务。
- 迁移完成后,验证数据完整性。
- 回到OpenSearch集群,进入OpenSearch Dashboards的“Dev Tools”页面。
- 执行如下命令,搜索导入的索引数据。
GET demo/_count # 查看数据量 GET demo/_search # 查看数据内容
如果返回的数据内容与源数据一致,则表示导入成功。
父主题: 数据导入
