基于Slurm构建泛HPC场景云上云下资源协同解决方案

基于Slurm构建泛HPC场景云上云下资源协同解决方案

    集群管控 更多内容
  • 权限管控

    组(system:anonymous/system:unauthenticated)对应RBAC权限进行严格,避免对匿名请求授予的权限过大引入安全风险 父主题: 集群

    来自:帮助中心

    查看更多 →

  • 集群纳管

    集群 查看集群 资源管理 父主题: 运维配置

    来自:帮助中心

    查看更多 →

  • 升级管控检查异常处理

    升级检查异常处理 检查项内容 检查集群是否处于升级中。 解决方案 CCE基于以下几点原因,可能会暂时限制该集群的升级功能: 基于用户提供的信息,该集群被识别为核心重点保障的生产集群。 正在或即将进行其他运维任务,例如Master节点3AZ改造等。 请根据界面日志联系技术支持人员了解限制原因并申请解除升级限制。

    来自:帮助中心

    查看更多 →

  • 查看集群纳管

    以适配资源规格。如果用户直接通过后台操作k8s集群及节点造成环境错乱,则需承担责任。 图1 集群列表 集群相关操作 在“集群”列表,可对纳进行以下操作。 表1 集群相关操作 任务 操作步骤 查询纳 在搜索输入框中输入搜索条件,按回车键即可查询。 筛选纳

    来自:帮助中心

    查看更多 →

  • 升级管控检查异常处理

    升级检查异常处理 检查项内容 检查集群是否处于升级中。 解决方案 CCE基于以下几点原因,可能会暂时限制该集群的升级功能: 基于用户提供的信息,该集群被识别为核心重点保障的生产集群。 正在或即将进行其他运维任务,例如Master节点3AZ改造等。 请根据界面日志联系技术支持人员了解限制原因并申请解除升级限制。

    来自:帮助中心

    查看更多 →

  • 通过视图管控数据权限

    通过视图数据权限 本章节介绍如何通过视图实现给不同的用户授予查询同一表中不同数据的权限,提供数据的权限管理和安全性。 场景 dbadmin用户连接集群后,创建示例表customer: 1 CREATE TABLE customer (id bigserial NOT NULL

    来自:帮助中心

    查看更多 →

  • ALM-14037 存在集群外的DataNode

    ALM-14037 存在集群外的DataNode 告警解释 NameNode每8个小时周期性检查集群中是否存在脱离的DataNode。如果存在则触发该告警。如果无脱离的DataNode则告警清除。 该告警仅适用于 MRS 3.3.1及之后版本。 告警属性 告警ID 告警级别

    来自:帮助中心

    查看更多 →

  • 增加环境管理,满足多环境差异化管控

    增加环境管理,满足多环境差异化 部署服务应用下增加环境管理功能,可托管由主机/代理机组成的主机集群以及Kubernetes集群(即将上线)等环境资源。环境权限管理精确化,进一步规范应用(软件包)跟环境的依赖关系,实现环境的应用级隔离,差异化。 父主题: 功能特性

    来自:帮助中心

    查看更多 →

  • 如何调整纳管集群的资源占用量?

    如何调整纳集群的资源占用量? 集群成功后会在集群中新增一个ers-manager命名空间,并拉起一个名称为ers-cluster-agent-XXX的pod,用来定期向ERS上报数据,约占用660M4.5Gi的资源,可以通过修改pod的YAML文件中各插件(containe

    来自:帮助中心

    查看更多 →

  • 添加资源池

    资源池中的最大查询并发数。 内存和查询并发支持单独和联合,联合时必须同时满足并发和内存要求时作业才能下发。 10 网络带宽权重 网络调度时权重值。取值范围为1~2147483647的整数,默认配置为-1。 注意: 网络带宽权重仅8.2.1及以上集群版本支持,存算分离集群不支持。 -1(不限制)

    来自:帮助中心

    查看更多 →

  • 负载弹性伸缩控制器(horizontal-pod-autoscaler-controller)配置

    数量的周期。配置越小弹性伸缩器反应越及时,同时CPU负载也越高 配置建议: 无特殊需求建议保持默认配置 并发数量设置过小可能导致管理器处理响应慢,设置过大会对集群管控面造成压力,产生过载风险 Pod水平伸缩容忍度 此值为目标值与实际值的比值与 1.0 的差值。只有超过此标志所设的阈值时, HPA 才会考虑执行缩放操作

    来自:帮助中心

    查看更多 →

  • 在ERS管理已纳管的容器集群

    可以修改纳集群的环境、集群名称,单击“确定”。 取消纳集群集群列表中,单击集群所在行操作列的“更多 > 删除纳”。 输入集群名称,单击“确定”。 编辑集群标签 在集群列表中,单击集群所在行操作列的“更多 > 编辑标签”。 为标签编辑键值信息,单击“保存”。 父主题: 使用弹性资源服务管理容器集群

    来自:帮助中心

    查看更多 →

  • 权限治理使用流程

    支持空间资源 除了数据权限外,还支持对空间资源进行,例如数据连接、委托等资源。 使用流程 您可通过图1了解统一权限治理的使用流程。 图1 统一权限治理使用流程图 统一权限治理支持数据权限、服务资源和Ranger权限管理,流程介绍如下: 数据权限流程 授权dlg_agency委托

    来自:帮助中心

    查看更多 →

  • 修改资源池

    资源池中的最大查询并发数。 内存和查询并发支持单独和联合,联合时必须同时满足并发和内存要求时作业才能下发。 10 网络带宽权重 网络调度时权重值。取值范围为1~2147483647的整数,默认配置为-1。 注意: 网络带宽权重仅8.2.1及以上集群版本支持,存算分离集群不支持。 -1(不限制)

    来自:帮助中心

    查看更多 →

  • 集群控制器并发配置

    响应越快,但 CPU(和网络)负载也越高 配置建议: 无特殊需求建议保持默认配置 并发数量设置过小可能导致管理器处理响应慢,设置过大会对集群管控面造成压力,产生过载风险 endpoint并发处理数 参数名 取值范围 默认值 是否允许修改 作用范围 concurrent-endpoint-syncs

    来自:帮助中心

    查看更多 →

  • 集群

    集群 基础配置 网络 认证 访问配置 权限 容器驱逐配置 端口范围配置 特性开关 调度器性能配置 集群调度器配置 调度算法 部署策略 控制器性能配置 集群控制器并发配置 节点生命周期控制器(node-lifecycle-controller)配置 负载弹性伸缩控制器(hori

    来自:帮助中心

    查看更多 →

  • HetuEngine用户权限说明

    e基于Ranger权限。 Metastore权限方式,可参考HetuEngine基于MetaStore权限。 Ranger和MetaStore的差异见下表,两者都支持用户、用户组以及角色的鉴权。 表1 Ranger和MetaSore差异 权限方式 权限模型 支持的数据源

    来自:帮助中心

    查看更多 →

  • GS_QUERY_MONITOR

    Complicated:复杂作业。 作业进入资源池前无意义,只有进入或已完成资源池该字段才有意义。 lane text 作业排队/执行所处的资源池车道: fast:快车道; slow:慢车道。 作业进入资源池前无意义,只有进入或已完成资源池该字段才有意义。 status text

    来自:帮助中心

    查看更多 →

  • 纳管节点

    如果使用了企业项目,则待纳节点需要和集群在同一企业项目下,不然在纳时会识别不到资源,导致无法纳。从v1.21.15-r0、v1.23.14-r0、v1.25.9-r0、v1.27.6-r0、v1.28.4-r0集群版本开始,待纳节点无需和集群在同一企业项目下,纳后节点的企业项目保持不变。

    来自:帮助中心

    查看更多 →

  • PG_RESOURCE_POOL

    short_acc boolean 资源池是否开启短查询加速,默认开启。 短查询加速开启,简单查询在快车道。 短查询加速关闭,简单查询在慢车道。 except_rule text 资源池关联的异常规则,支持关联多个异常规则,异常规则间用逗号分隔。 weight integer

    来自:帮助中心

    查看更多 →

  • 纳管节点

    6-r0、v1.28.4-r0集群版本开始,待纳节点无需和集群在同一企业项目下,纳后节点的企业项目保持不变。 集群开启IPv6后,只支持纳所在的子网开启了IPv6功能的节点;集群未开启IPv6,只支持纳所在的子网未开启IPv6功能的节点。 CCE Turbo 集群要求节点支持Sub-

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了