更新时间:2024-10-14 GMT+08:00

步骤2:在数据服务器上安装配置和启动GDS

获取驱动包

根据不同版本的实例,下载不同版本的发布包,如表1所示。

表1 驱动包下载列表

版本

下载地址

V2.0-8.x

驱动包

驱动包校验包

V2.0-3.x

驱动包

驱动包校验包

V2.0-2.x

驱动包

驱动包校验包

为了防止软件包在传递过程或存储期间被恶意篡改,下载软件包时需下载对应的校验包对软件包进行校验,校验方法如下:

  1. 上传软件包和软件包校验包到虚拟机(Linux操作系统)的同一目录下。
  2. 执行如下命令,校验软件包完整性。

    cat GaussDB_driver.zip.sha256 | sha256sum --check

    如果回显OK,则校验通过。

    GaussDB_driver.zip: OK

在存放数据源文件的服务器上,安装配置并启动GDS服务。以便后续应用GDS服务连通GaussDB,进行数据导入。

  1. 登录待安装GDS的数据服务器192.168.0.90,创建用户gds_user及其所属的用户组gdsgrp。此用户用于启动GDS,且需要拥有读取数据源文件目录的权限。

    groupadd gdsgrp
    useradd -g gdsgrp gds_user

  2. 切换到用户gds_user。

    su - gds_user

  3. 创建存放GDS工具包的目录/opt/bin。

    mkdir -p /opt/bin

  4. 修改工具包以及数据源文件目录属主为创建的用户gds_user及其所属的用户组gdsgrp。

    chown -R gds_user:gdsgrp /opt/bin
    chown -R gds_user:gdsgrp /input_data

  5. 将GDS工具包上传至上一步所创建的目录中。

    以上传EULER Linux版本的工具包为例,将软件安装包中的GDS工具包“GaussDB-Kernel-VxxxRxxxCxx-xxxxx-64bit-Gds.tar.gz”上传至上一步所创建的目录中。

    GaussDB-Kernel-VxxxRxxxCxx-xxxxx-64bit-Gds.tar.gz下载链接驱动包

  6. 在工具包所在目录下,解压工具包。

    cd /opt/bin
    tar -zxvf GaussDB-Kernel-VxxxRxxxCxx-xxxxx-64bit-Gds.tar.gz
    export LD_LIBRARY_PATH="/opt/bin/lib:$LD_LIBRARY_PATH"  // GDS依赖了Cjson动态库,使用时,需配置动态库路径。

  7. (可选)如果使用SSL加密传输数据,请一并将SSL证书上传1所创建的目录中。

    证书位于GaussDB集群中的“$GAUSSHOME/share/sslcert/gds”下。

    例如,假设GaussDB集群服务器(192.168.10.60)上,$GAUSSHOME对应的路径为“/opt/huawei/Bigdata/gaussdb/core”,预将gds对应的SSL证书下载到上面创建的“/opt/bin”下。可以使用如下命令:

    scp -r root@192.168.10.60:/opt/huawei/Bigdata/gaussdb/core/share/sslcert/gds ./

  8. 启动GDS。

    • 非SSL模式传输数据的情况下,使用如下命令启动GDS。
      /opt/bin/gds/gds -d /input_data/ -p 192.168.0.90:5000 -H 10.10.0.1/24 -l /opt/bin/gds/gds_log.txt -D --enable-ssl off
    • 使用SSL加密方式传输数据时,在确保执行了7后,使用如下命令启动GDS。
      /opt/bin/gds/gds -d /input_data/ -p 192.168.0.90:5000 -H 10.10.0.1/24 -l /opt/bin/gds/gds_log.txt -D --enable-ssl on --ssl-dir /opt/bin/gds

    命令中的斜体部分请根据实际填写。

    • -d dir:保存有待导入数据的数据文件所在目录。本教程中为“/input_data/”。
    • -p ip:port:GDS侦听IP和侦听端口。默认值为:127.0.0.1,需要替换为能跟GaussDB通信的万兆网IP。侦听端口的取值范围:1024~65535。默认值为:8098。本教程配置为:192.168.0.90:5000。
    • -H address_string:允许哪些主机连接和使用GDS服务。参数需为CIDR格式。此参数配置的目的是允许GaussDB集群可以访问GDS服务进行数据导入。所以请保证所配置的网段包含GaussDB集群各主机。
    • -l log_file:存放GDS的日志文件路径及文件名。本教程为“/opt/bin/gds/gds_log.txt”。
    • -D:后台运行GDS。仅支持Linux操作系统下使用。
    • --enable-ssl:选择SSL加密方式传输数据,默认不输入时为开启,不使用该参数时需输入--ssl-dir指定SSL证书路径。
    • --ssl-dir:SSL证书所在目录。需与7中的证书保存目录保持一致。