更新时间:2024-10-14 GMT+08:00
步骤2:在数据服务器上安装配置和启动GDS
在存放数据源文件的服务器上,安装配置并启动GDS服务。以便后续应用GDS服务连通GaussDB,进行数据导入。
- 登录待安装GDS的数据服务器192.168.0.90,创建用户gds_user及其所属的用户组gdsgrp。此用户用于启动GDS,且需要拥有读取数据源文件目录的权限。
groupadd gdsgrp useradd -g gdsgrp gds_user
- 切换到用户gds_user。
su - gds_user
- 创建存放GDS工具包的目录/opt/bin。
mkdir -p /opt/bin
- 修改工具包以及数据源文件目录属主为创建的用户gds_user及其所属的用户组gdsgrp。
chown -R gds_user:gdsgrp /opt/bin chown -R gds_user:gdsgrp /input_data
- 将GDS工具包上传至上一步所创建的目录中。
以上传EULER Linux版本的工具包为例,将软件安装包中的GDS工具包“GaussDB-Kernel-VxxxRxxxCxx-xxxxx-64bit-Gds.tar.gz”上传至上一步所创建的目录中。
GaussDB-Kernel-VxxxRxxxCxx-xxxxx-64bit-Gds.tar.gz下载链接驱动包。
- 在工具包所在目录下,解压工具包。
cd /opt/bin tar -zxvf GaussDB-Kernel-VxxxRxxxCxx-xxxxx-64bit-Gds.tar.gz export LD_LIBRARY_PATH="/opt/bin/lib:$LD_LIBRARY_PATH" // GDS依赖了Cjson动态库,使用时,需配置动态库路径。
- (可选)如果使用SSL加密传输数据,请一并将SSL证书上传1所创建的目录中。
证书位于GaussDB集群中的“$GAUSSHOME/share/sslcert/gds”下。
例如,假设GaussDB集群服务器(192.168.10.60)上,$GAUSSHOME对应的路径为“/opt/huawei/Bigdata/gaussdb/core”,预将gds对应的SSL证书下载到上面创建的“/opt/bin”下。可以使用如下命令:
scp -r root@192.168.10.60:/opt/huawei/Bigdata/gaussdb/core/share/sslcert/gds ./
- 启动GDS。
- 非SSL模式传输数据的情况下,使用如下命令启动GDS。
/opt/bin/gds/gds -d /input_data/ -p 192.168.0.90:5000 -H 10.10.0.1/24 -l /opt/bin/gds/gds_log.txt -D --enable-ssl off
- 使用SSL加密方式传输数据时,在确保执行了7后,使用如下命令启动GDS。
/opt/bin/gds/gds -d /input_data/ -p 192.168.0.90:5000 -H 10.10.0.1/24 -l /opt/bin/gds/gds_log.txt -D --enable-ssl on --ssl-dir /opt/bin/gds
命令中的斜体部分请根据实际填写。
- -d dir:保存有待导入数据的数据文件所在目录。本教程中为“/input_data/”。
- -p ip:port:GDS侦听IP和侦听端口。默认值为:127.0.0.1,需要替换为能跟GaussDB通信的万兆网IP。侦听端口的取值范围:1024~65535。默认值为:8098。本教程配置为:192.168.0.90:5000。
- -H address_string:允许哪些主机连接和使用GDS服务。参数需为CIDR格式。此参数配置的目的是允许GaussDB集群可以访问GDS服务进行数据导入。所以请保证所配置的网段包含GaussDB集群各主机。
- -l log_file:存放GDS的日志文件路径及文件名。本教程为“/opt/bin/gds/gds_log.txt”。
- -D:后台运行GDS。仅支持Linux操作系统下使用。
- --enable-ssl:选择SSL加密方式传输数据,默认不输入时为开启,不使用该参数时需输入--ssl-dir指定SSL证书路径。
- --ssl-dir:SSL证书所在目录。需与7中的证书保存目录保持一致。
- 非SSL模式传输数据的情况下,使用如下命令启动GDS。
父主题: 教程:使用GDS从远端服务器导入数据