云容器引擎 CCE

 

云容器引擎(Cloud Container Engine)提供高可靠高性能的企业级容器应用管理服务,支持Kubernetes社区原生应用和工具,简化云上自动化容器运行环境搭建

 
 

    云容器引擎volcano 更多内容
  • 云原生混部概述

    着性能和服务质量的平衡点。面对这样复杂的场景,应该如何化繁为简,帮助用户有步骤的提升资源利用率和控制成本呢? CCE通过多年在混合部署领域的探索和实践,围绕Volcano和Kubernetes生态,构建帮助用户提升资源利用率,实现降本增效的云原生混部解决方案。 如上图所示,混部不

    来自:帮助中心

    查看更多 →

  • 重调度(Descheduler)

    配置负载感知重调度(LoadAware)时,Volcano调度器需要同时开启负载感知调度;配置CPU和内存资源碎片率整理策略(HighNodeUtilization)时,Volcano调度器需要同时开启binpack调度策略。 配置负载感知重调度策略 配置负载感知重调度(LoadAware)时,Volcano调度器需要同时开启负载感知调度,示例步骤如下。

    来自:帮助中心

    查看更多 →

  • 查询所有batch.volcano.sh/v1alpha1的API

    查询所有batch.volcano.sh/v1alpha1的API 功能介绍 查询所有batch.volcano.sh/v1alpha1的API 调用方法 请参见如何调用API。 URI GET /apis/batch.volcano.sh/v1alpha1 请求参数 表1 请求Header参数

    来自:帮助中心

    查看更多 →

  • 购买Standard/Turbo集群

    可选插件。勾选后自动安装节点本地 域名 解析加速插件,通过在集群节点上运行 DNS 缓存代理来提高集群 DNS 性能。 Volcano调度器 可选插件。勾选后自动安装Volcano调度器插件,并将集群的默认调度器设置为Volcano,为您提供面向批量计算、高性能计算场景的高级调度能力。 CCE突发弹性引擎(对接CCI)

    来自:帮助中心

    查看更多 →

  • 工作负载Pod异常

    态异常定位方法。 通过以下命令打印Pod日志信息。 kubectl describe pod ${pod_name} volcano资源调度失败 当volcano的资源出现争抢时,会出现下图中的问题。 解决方法: 通过打印所有Pod的信息,并找到命名有scheduler字段的Pod。

    来自:帮助中心

    查看更多 →

  • 部署策略

    节点异常时等待指定时间再驱逐插件volcano容器实例,提高插件可用性 参数名 取值范围 默认值 是否允许修改 作用范围 toleration taints的社区配置 无 允许 CCE Standard/ CCE Turbo 默认节点60s不可用再驱逐volcano容器 配置建议: 使用默认配置

    来自:帮助中心

    查看更多 →

  • 功能总览

    购买Standard/Turbo集群 购买Autopilot集群 通过kubectl连接CCE集群 CCE Autopilot集群 CCE Autopilot是云容器引擎服务推出的Serverless版集群,为您提供免运维的容器服务,并提供经过优化的Kubernetes兼容能力。 在创建CCE Autop

    来自:帮助中心

    查看更多 →

  • 集群成本管理最佳实践

    access)节点访问会导致增加延迟和开销,从而降低系统性能。为此,volcano实现了NUMA亲和性调度策略,尽可能把Pod调度到需要跨NUMA节点最少的工作节点上,这种调度策略能够降低数据传输开销,优化资源利用率,从而增强系统的整体性能。 Volcano的目标是解决调度程序NUMA拓扑感知的限制,以便实现以下目标:

    来自:帮助中心

    查看更多 →

  • API groups

    查询所有apps/v1的API 查询APIGroup /apis/batch 查询APIGroup /apis/batch.volcano.sh 查询所有batch.volcano.sh/v1alpha1的API 查询所有batch/v1的API 查询所有batch/v1beta1的API 查询APIGroup

    来自:帮助中心

    查看更多 →

  • 业务优先级保障调度

    业务优先级保障调度 优先级调度与抢占 父主题: Volcano调度

    来自:帮助中心

    查看更多 →

  • AI任务性能增强调度

    AI任务性能增强调度 公平调度(DRF) 组调度(Gang) 父主题: Volcano调度

    来自:帮助中心

    查看更多 →

  • 云审计服务支持的CCI操作列表

    deleteKubeflowJob 创建Volcano job createVolcanoJob 删除指定Namespace下所有的Volcano job deleteVolcanoJobsByNamespace 替换指定Volcano job replaceVolcanoJob 更新指定Volcano job

    来自:帮助中心

    查看更多 →

  • 工作负载Pod异常

    态异常定位方法。 通过以下命令打印Pod日志信息。 kubectl describe pod ${pod_name} volcano资源调度失败 当volcano的资源出现争抢时,会出现下图中的问题。 解决方法: 通过打印所有Pod的信息,并找到命名有scheduler字段的Pod。

    来自:帮助中心

    查看更多 →

  • CPU Burst弹性限流

    app: nginx annotations: volcano.sh/enable-quota-burst: "true" volcano.sh/quota-burst-time: "200000" spec:

    来自:帮助中心

    查看更多 →

  • 调度

    调度 调度概述 CPU调度 GPU调度 NPU调度 Volcano调度 云原生混部

    来自:帮助中心

    查看更多 →

  • 插件管理

    插件管理 kube-prometheus-stack插件 log-agent插件 metrics-server volcano huawei-npu插件 gpu-device-plugin e-backup插件 父主题: 单集群管理

    来自:帮助中心

    查看更多 →

  • 在Lite Cluster资源池上使用Snt9B完成分布式训练任务

    Cluster资源池上使用Snt9B完成分布式训练任务 场景描述 本案例介绍如何在Snt9B上进行分布式训练任务,其中Cluster资源池已经默认安装volcano调度器,训练任务默认使用volcano job形式下发lite池集群。训练测试用例使用NLP的bert模型,详细代码和指导可参考Bert。 图1 任务示意图

    来自:帮助中心

    查看更多 →

  • gpu-device-plugin

    U单卡的算力、显存分割与隔离。 若集群中未安装volcano插件,将不支持开启GPU虚拟化,您可单击“一键安装”进行安装。如需配置volcano插件参数,请单击“自定义安装”,详情请参见volcano。 若集群中已安装volcano插件,但插件版本不支持使用GPU虚拟化,您可单击

    来自:帮助中心

    查看更多 →

  • 在CCE集群中部署使用Kubeflow

    在CCE集群中部署使用Kubeflow Kubeflow部署 Tensorflow训练 使用Kubeflow和Volcano实现典型AI训练任务 父主题: 批量计算

    来自:帮助中心

    查看更多 →

  • huawei-npu插件

    像识别等工作。 前置条件 安装huawei-npu的节点需要添加标签“accelerator/huawei-npu”,标签值可为空。 使用npu插件在Ascend Snt9设备上运行,需先安装volcano插件。 约束与限制 该功能支持v1.28及以上本地集群版本。 目前仅支持arm架构,HCE2

    来自:帮助中心

    查看更多 →

  • 公平调度(DRF)

    ,提高训练性能。 前提条件 已创建v1.19及以上版本的集群,详情请参见购买Standard/Turbo集群。 已安装Volcano插件,详情请参见Volcano调度器。 公平调度介绍 在实际业务中,经常会遇到将集群稀缺资源分配给多个用户的情况,每个用户获得资源的权利都相同,但是

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了