华为云

面向未来的智能世界,数字化是企业发展的必由之路。数字化成功的关键是以云原生的思维践行云原生,全数字化、全云化、AI驱动,一切皆服务。

华为云将持续创新,携手客户、合作伙伴和开发者,致力于让云无处不在,让智能无所不及,共建智能世界云底座。

 
 

    华为云节点池 更多内容
  • 如何通过ssh登录专属资源池节点?

    如何通过ssh登录专属资源节点? ModelArts专属资源不支持ssh登录节点。 父主题: Standard资源

    来自:帮助中心

    查看更多 →

  • 查询指定节点池支持配置的参数内容

    查询指定节点支持配置的参数内容 功能介绍 该API用于查询指定节点支持配置的参数内容。 调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_id}/clusters/{cluster_id}/nodepools/{nodepo

    来自:帮助中心

    查看更多 →

  • 管理Standard专属资源池的游离节点

    管理Standard专属资源的游离节点 如果资源中存在游离节点,即没有被纳管到资源池中的节点,可在“AI专属资源 > 弹性集群Cluster >节点”下查看此类节点的相关信息。 系统支持对游离节点进行续费、退订、开通/修改自动续费、添加/编辑资源标签、删除资源标签、搜索等操作。

    来自:帮助中心

    查看更多 →

  • Standard资源池节点故障定位

    Standard资源节点故障定位 节点故障定位 对于Standard资源,ModelArts平台在识别到节点故障后,通过给K8S节点增加污点的方式(taint)将节点隔离避免新作业调度到该节点而受到影响,并且使本次作业不受污点影响。当前可识别的故障类型如下,可通过隔离码及对应检测方法定位故障。

    来自:帮助中心

    查看更多 →

  • 节点池弹性伸缩优先级说明

    调度的条件。 另外,部分节点规格由于资源不足等扩容失败进入5min冷却期后,冷却期间扩容算法会自动过滤此类规格。 节点优先级排序: 为每个节点分配一个优先级,根据节点优先级进行排序,优先选择优先级最高的节点。 规格优先级选择: 如果存在多个节点优先级最高的情况,则根据以下原则挑选优先级最高的规格:

    来自:帮助中心

    查看更多 →

  • 节点池批量扩缩容节点时,Kubernetes Event事件存在部分缺失

    节点批量扩缩容节点时,Kubernetes Event事件存在部分缺失 问题现象 节点批量扩缩容节点时,Kubernetes Event事件存在部分缺失。 例如,集群中批量缩容10个节点,CCE打印了10次“删除节点”事件,但是Kubernetes仅打印了4次“缩容空闲节点启动”的Event事件。

    来自:帮助中心

    查看更多 →

  • 节点池运行时检查异常处理

    节点运行时检查异常处理 检查项内容 该告警通常发生在低版本集群升级到v1.27及以上集群。CCE不建议您在1.27以上版本集群中继续使用docker,并计划在未来移除对docker的支持。 解决方案 若您的节点的运行时非containerd,您可通过更新节点功能将节点的运行时修改为containerd。

    来自:帮助中心

    查看更多 →

  • 管理Lite Cluster资源池的游离节点

    管理Lite Cluster资源的游离节点 如果资源中存在游离节点,即没有被纳管到资源池中的节点,可在“AI专属资源 > 弹性集群Cluster >节点”下查看此类节点的相关信息。 系统支持对游离节点进行续费、退订、开通/修改自动续费、添加/编辑资源标签、删除资源标签、搜索等操作。

    来自:帮助中心

    查看更多 →

  • Cluster资源池节点故障如何定位

    Cluster资源节点故障如何定位 故障说明和处理建议 图1 Lite故障处理流程 对于ModelArts Lite资源,每个节点会以DaemonSet方式部署node-agent组件,该组件会检测节点状态,并将检测结果写到K8S NodeCondtition中。同时,节点故障指标默

    来自:帮助中心

    查看更多 →

  • 升级Lite Cluster资源池单个节点驱动

    Cluster资源节点驱动状态处于运行中,且专属池中的节点需要含有GPU/Ascend资源。 节点驱动升级操作 登录ModelArts管理控制台,在左侧菜单栏中选择“AI专属资源 > 弹性集群 Cluster”,在“弹性集群”页面,选择“Lite资源”页签,查看资源列表。 进入

    来自:帮助中心

    查看更多 →

  • 资源池

    资源 创建资源失败 Standard资源节点故障定位 资源推理服务一直初始化中如何解决 专属资源关联SFS Turbo显示异常

    来自:帮助中心

    查看更多 →

  • 桌面池退订

    桌面退订 操作场景 该任务指导管理员在管理控制台上退订桌面桌面。 操作步骤 登录管理控制台。 在左侧导航栏中依次选择“桌面管理 > 桌面”。 进入“桌面”页面。 在桌面页面单击计费模式为包年/包月的待续费的桌面名称,进入桌面“基本信息”界面。 勾选计费模式为包年/包

    来自:帮助中心

    查看更多 →

  • 1个节点的专属资源池,能否部署多个服务?

    1个节点的专属资源,能否部署多个服务? 支持。 在部署服务时,选择专属资源,在选择“计算节点规格”时选择“自定义规格”,设置小一些或者选择小规格的服务节点规格,当资源节点可以容纳多个服务节点规格时,就可以部署多个服务。如果使用此方式进行部署推理,选择的规格务必满足模型的要求

    来自:帮助中心

    查看更多 →

  • 查询指定节点池支持配置的参数列表

    查询指定节点支持配置的参数列表 功能介绍 该API用于查询CCE服务下指定节点支持配置的参数列表。 调用方法 请参见如何调用API。 URI GET /api/v3/projects/{project_id}/clusters/{cluster_id}/nodepools/{

    来自:帮助中心

    查看更多 →

  • 管理Lite Cluster节点

    当操作记录里有节点处于替换中时,该资源无法进行重置节点操作。 当资源处于驱动升级状态时,该资源无法进行重置节点操作。 GPU和NPU规格,重置节点完成后,节点可能会出现驱动升级的现象,请耐心等待。 修复节点 修复节点功能是白名单功能,如果有试用需求,请提工单申请权限。 若资源节点发生硬件故障,修复按钮变

    来自:帮助中心

    查看更多 →

  • 开始使用

    开始使用 登录华为云CCE云容器引擎控制台,选择“北京四”区域,在“资源管理 > 集群管理”中,可以看到该方案创建出来的CCE集群。 图1 CCE集群 在华为云CCE云容器引擎控制台的“资源管理 > 节点管理”中,可以看到该方案创建的节点。 图2 E CS 控制台 在华为云CCE云容器引擎控制台的“资源管理

    来自:帮助中心

    查看更多 →

  • 节点

    节点 kubelet性能配置 kubelet配置 kube-proxy配置 计算配置

    来自:帮助中心

    查看更多 →

  • 连接池参数

    ,会导致节点创建失败。由于CN启动时,会根据参数值提前申请内存,所以当该参数值变大,系统会消耗更多内存资源,但总体来说对CN内存影响不大。 cache_connection 参数说明:是否回收连接的连接。 参数类型:布尔型 参数单位:无 取值范围: on:表示回收连接的连接。

    来自:帮助中心

    查看更多 →

  • 节点池一直在扩容中但“操作记录”里为何没有创建节点的记录?

    节点一直在扩容中但“操作记录”里为何没有创建节点的记录? 问题现象 节点的状态一直处于“扩容中”,但是“操作记录”里面没有看到有对应创建节点的记录。 原因排查: 检查如下问题并修复: 租户是否欠费。 查看节点配置的规格是否资源不足。 租户的ECS或内存配额是否不足。 如果一

    来自:帮助中心

    查看更多 →

  • 删除资源池

    资源池业务状态信息。 driver driver object 资源驱动信息。 parent String 资源节点名称,物理为空。 root String 资源节点名称,物理为自己的名称。 表13 resources 参数 参数类型 描述 creating PoolResourceFlavorCount

    来自:帮助中心

    查看更多 →

  • 添加资源池

    添加资源 登录 GaussDB (DWS)管理控制台。 在集群列表中单击需要访问“资源管理”页面的集群名称。 切换至“资源管理”页签。 单击资源列旁的“添加资源”按钮添加资源。 最多可创建63个资源。 参见表1填写资源的名称和相关资源配置。 表1 资源参数 参数项 描述

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了