更新时间:2022-08-16 GMT+08:00

创建集群

如果用户需要在华为云环境中使用GaussDB(DWS) ,首先要创建一个数据仓库集群。

本章节为您介绍如何在GaussDB(DWS) 管理控制台创建一个数据仓库集群。

创建集群前的准备

  • 评估集群节点规格

    您可以根据数据量、业务负载以及性能需求,选择能够支撑业务应用的节点数量,数量越多,存储与计算能力越强。GaussDB(DWS) 集群中,每个节点上的DataNode实例数根据集群规格不同而不同,一般为1~4个。DataNode实例负责存储业务数据(支持行存、列存、混合存储)、执行数据查询任务以及返回执行结果的模块。

    刚开始使用GaussDB(DWS) 服务时,您也可以先创建一个规格较小的集群,今后随着数据量和业务负载的变化,再自由调整集群规模和节点规格,自由扩展而不中断业务。详情请参见扩容集群

  • 设计网络访问拓扑

    根据业务应用需要,规划合适的可用区并准备网络配置,使数据仓库集群与用户的其他云业务隔离。

  • 请确定用户可使用的节点数满足如下条件,否则系统会提示无法创建集群。
    • 用户可使用的节点数大于或者等于3,因为创建集群至少需要3个节点。用户可使用的节点数可在“集群管理”页面查看。
    • 计划创建的集群的节点数小于或等于用户可使用的节点数。

创建集群

  1. 登录GaussDB(DWS) 管理控制台。
  2. 单击左侧导航栏的“集群管理”
  3. “集群管理”页面,单击“创建数据仓库集群”
  4. 选择“区域”

    表1 区域参数说明

    参数名

    参数解释

    样例值

    区域

    选择集群节点实际工作区域。

    有关区域的详细信息,请参见地区和终端节点

    -

    可用区

    选择集群工作区域下关联的可用区。

    关于区域和可用区的描述,请参见区域和可用区

    -

  5. 选择“产品类型”、“CPU架构”和“节点规格”。

    图1 选择节点规格
    表2 主机规格参数说明

    参数名

    参数解释

    样例值

    集群类型

    集群类型有:

    • 标准数仓:OLAP,支持10PB级超大规模数据在线查询、离线分析能力,可扩展至1024节点。

    标准数仓

    CPU架构

    CPU架构有:

    • X86
    说明:

    X86和鲲鹏只是底层架构不一致,应用层不感知,sql语法一致,如果创建集群时提示X86售罄,可以选择鲲鹏架构。

    X86

    节点规格

    请根据业务需求合理选择节点规格。在节点规格列表中展示了每一种节点规格单个节点的vCPU、内存和建议使用场景。

    dws.m3.xlarge

    节点数量

    选择集群中的节点个数。

    支持的节点数范围为3~256。

    3

    总容量(GB)

    显示集群的总容量。

    各个规格对应的存储容量均为数据库存储数据的实际空间,所展示存储容量已扣除副本、RAID所消耗的磁盘空间。

    -

  6. 填写“集群配置”参数。

    图2 集群参数
    表3 集群配置参数说明

    参数名

    参数解释

    样例值

    集群名称

    设置数据仓库集群的名称。

    集群名称长度为4到64个字符,必须以字母开头,可以包含字母、数字、中划线或者下划线,不能包含其他的特殊字符。字母不区分大小写。

    说明:

    集群创建成功后不支持修改集群名称。

    dws-demo

    集群版本

    显示集群中安装的数据库实例版本。图片仅供参考,请以实际显示版本号为准。

    8.1.1.202

    默认数据库

    显示集群的默认数据库名称gaussdb

    说明:

    gaussdb为默认数据库名称,暂不支持修改。

    gaussdb

    管理员用户

    设置数据库管理员用户名称。

    用户命名要求如下:

    • 只能由小写字母、数字或下划线组成。
    • 必须以小写字母或下划线开头。
    • 长度为6~64个字符。
    • 用户名不能为GaussDB(DWS) 数据库的关键字。GaussDB(DWS) 数据库的关键字,具体请参见《数据仓库服务数据库开发指南》“SQL参考 > 关键字”章节。

    dbadmin

    管理员密码

    设置数据库管理员用户的密码。

    密码复杂度要求如下:
    • 密码长度为8~32个字符。
    • 不能与用户名或倒序的用户名相同。
    • 密码至少包含大写字母、小写字母、数字和特殊字符四类中的三类,其中可输入的特殊字符为:(~!`?,.:;-_'"(){}[]/<>@#%^&*+|\=)。
    • 弱口令检查。
    说明:

    请妥善保管并定期更新密码,避免安全风险。

    -

    确认密码

    重复输入一次数据库数据库管理员用户的密码。

    -

    数据库端口

    设置客户端或应用程序连接集群数据库时使用的端口。

    支持的端口范围为8000~30000。

    8000

  7. 配置“网络”

    图3 网络配置
    表4 网络参数说明

    参数名

    参数解释

    样例值

    虚拟私有云

    指定集群节点使用的虚拟专用网络,实现不同业务的网络隔离。

    首次创建数据仓库集群时,如果未配置过虚拟私有云,可以单击“查看虚拟私有云”进入虚拟私有云管理控制台,新创建一个满足需求的虚拟私有云。

    如何创建虚拟私有云,具体请参见《虚拟私有云用户指南》中“虚拟私有云和子网 > 创建虚拟私有云和子网”章节。

    在下拉框中选择一个虚拟私有云后,单击“查看虚拟私有云”可以进入虚拟私有云管理控制台查看虚拟私有云的详细信息。

    单击可以刷新“虚拟私有云”下拉框中选项值。

    vpc-dws

    子网

    指定虚拟私有云的一个子网。

    集群使用子网实现与其他网络的隔离,并独享所有网络资源,以提高网络安全。

    subnet-dws

    安全组

    指定虚拟私有云的安全组。

    安全组限制安全访问规则,加强集群与其它服务间的安全访问。

    • 自动创建安全组

      系统默认选中“自动创建安全组”,设置为该选项时,系统将会自动创建一个默认安全组。

      默认安全组的规则如下:出方向允许所有访问,入方向只开放用户设置的GaussDB(DWS) 集群的数据库端口。

      默认安全组的名称,其格式如下:dws-<集群名称>-<GaussDB(DWS) 集群的数据库端口>,例如,dws-dws-demo-8000。

      说明:

      如果安全组和安全组规则的配额不足,提交创建集群申请后系统会报错,用户可以选择已有的安全组后重试。

    • 手动创建并配置安全组

      用户也可以登录VPC管理控制台手动创建一个安全组,然后回到GaussDB(DWS) 创建集群页面,单击“安全组”下拉列表旁边的按钮,刷新后在“安全组”下拉列表中选择新建的安全组。

      为了使GaussDB(DWS) 客户端可以连接集群,用户需要在新建的安全组中添加一条入规则,开放GaussDB(DWS) 集群的数据库端口的访问权限。入规则示例如下:

      • 协议:TCP。
      • 端口范围:8000。指定为创建GaussDB(DWS) 集群时设置的数据库端口,这个端口是GaussDB(DWS) 用于接收客户端连接的端口。
      • 源地址:选中“IP地址”,然后指定为客户端主机的IP地址,例如“192.168.0.10/32”。

      安全组完成创建后,不支持更换,只支持修改。如何修改安全组请参见可以修改GaussDB(DWS) 集群的安全组吗

    自动创建安全组

    公网访问

    指定用户是否可以在互联网上使用客户端连接集群数据库。支持如下方式:

    • “暂不使用”:暂不使用弹性IP。
    • “自动分配”:用户指定弹性IP的带宽,系统将自动为集群分配独享带宽的弹性IP,通过弹性IP可以从互联网对集群进行访问。自动分配的弹性IP的带宽名称都是以集群名称开头的。
    • “使用已有”:为集群绑定指定的弹性IP。如果下拉框中没有可用的弹性IP,可以单击“创建弹性IP”进入弹性公网IP页面创建一个满足需要的弹性IP。带宽可根据用户需要设置。
    说明:
    • 每个区域的每个项目首次使用弹性IP绑定功能时,系统将提示创建名称为“DWSAccessVPC”委托以授权GaussDB(DWS) 访问VPC。授权成功后,GaussDB(DWS) 可以在绑定弹性IP的虚拟机故障时切换至健康虚拟机。
    • 默认情况下,只有华为云帐号或拥有Security Administrator权限的用户才具备创建委托的权限。帐号中的IAM用户,默认没有创建委托的权限,需联系有权限的用户在当前页面完成对GaussDB(DWS) 的委托授权。
    • 公网访问选择“暂不使用”,即不启用公网访问集群。在集群创建成功后,如果用户想通过公网访问集群,可以先为集群绑定弹性IP再创建公网域名,详情请参见创建公网域名

    自动分配

    带宽

    “公网访问”选择“自动分配”时,需指定弹性IP的带宽,设置范围:1~100Mbit/s。

    50Mbit/s

  8. 设置高级配置。选择“自定义”时,您可以设置以下高级配置参数,若选择“默认配置”,以下参数将使用它们的默认值。

    图4 自定义高级配置
    • 自动快照

      表示开启自动快照策略,默认为开启。开启后,系统会按照设定的时间和周期自动创建快照。开启时请设置以下快照策略参数。

      表5 快照策略参数说明

      参数名

      参数解释

      保留天数

      设置自动创建的快照的保留天数,可设置范围为1~31天。

      说明:

      用户不能手动删除自动创建的快照,自动快照保留天数超期后,系统会自动删除。

      快照执行周期

      设置创建自动快照的周期。可以设置每周哪几天创建自动快照,以及创建自动快照的频率,支持每天创建一次或者每天间隔几个小时创建一次自动快照。

    • CN部署量

      CN即协调节点(Coordinator),负责接收来自应用的访问请求,并向客户端返回执行结果,此外,协调节点还负责分解任务,并调度任务分片在各DN上并行执行。

      取值范围为2~集群节点数-1,最大值为20,默认值为3。在大规模集群下,建议部署多个CN。

    • 参数模板

      参数模板是一组适用于数据仓库的参数集合。在“参数模板”下拉列表中选择一个参数模板与集群相关联。可以选择默认的参数模板或者自定义创建的参数模板。默认情况下,集群关联系统默认的数据库参数模板。

      有关参数模板的更多信息,请参见管理参数模板

    • 标签

      标签(Tag)用于标识集群的键值对。“键”和“值”请参见表6。默认未给集群添加标签。

      有关标签的更多信息,请参见标签简介

      表6 标签配置参数

      参数

      参数说明

      样例值

      您可以选择:

      • 在输入框的下拉列表中选择预定义标签键或集群已有的资源标签键。
        说明:

        如果添加预定义标签,用户需要预先在标签管理服务中创建好预定义标签,然后在“键”的下拉框中进行选择。用户可以通过单击“查看预定义标签”进入标签管理服务的“预定义标签”页面,然后单击“创建标签”来创建新的预定义标签。更多信息请参见《标签管理服务用户指南》中的“管理 > 预定义标签 > 创建预定义标签”章节。

      • 在输入框中输入标签键名称。输入标签键的最大长度为36个字符,不能为空字符串。

        只能包含数字、英文字母、下划线、中划线和中文。

        说明:

        同一集群中的键名不能重复。

      key01

      您可以选择:

      • 在输入框的下拉列表中选择预定义标签值或集群的资源标签值。
      • 在输入框中输入标签值。输入标签值的最大长度为43个字符,不能为空字符串。

        只能包含数字、英文字母、下划线、点、中划线和中文。

      value01

    • 加密数据库

      表示不启用数据库加密功能,默认为不启用。

      表示开启数据库加密功能。开启后,GaussDB(DWS) 将使用KMS(密钥管理服务)为集群及其快照的数据启用加密功能。

      每个区域的每个项目首次启用数据库加密时,系统会弹出一个“创建委托”的对话框,单击“是”创建名为“DWSAccessKMS”的委托以授权GaussDB(DWS) 访问KMS,若单击“否”将不会启用加密功能。然后在“密钥名称”的下拉列表中选择已创建的KMS密钥。

      默认情况下,只有华为云帐号或拥有Security Administrator权限的用户才具备创建委托的权限。帐号中的IAM用户,默认没有创建委托的权限,需联系有权限的用户在当前页面完成对GaussDB(DWS) 的委托授权。

      • 数据库加密功能一旦开启就无法关闭。
      • 开启数据库加密功能后,用于加密GaussDB(DWS) 数据库的KMS密钥在使用过程中不能被禁用、删除或冻结,否则会导致GaussDB(DWS) 集群异常或数据库不可用。
      • 开启数据库加密功能后创建的快照不支持使用openAPI做恢复。

  9. 单击“立即创建”,进入“规格详情”页面。
  10. 单击“提交”

    提交成功后开始创建。单击“返回集群列表”返回集群管理页面,所创集群的初始状态为“创建中”,集群创建需要时间,请等待一段时间。创建成功后状态更新为“可用”,用户可以开始使用集群。