云容器引擎 CCE

 

云容器引擎(Cloud Container Engine)提供高可靠高性能的企业级容器应用管理服务,支持Kubernetes社区原生应用和工具,简化云上自动化容器运行环境搭建

 
 

    机器学习模型docker调度 更多内容
  • 准备镜像

    在每个实例节点上运行此命令可以看到总卡数 如出现错误,可能是机器上的NPU设备没有正常安装,或者NPU镜像被其他容器挂载。请先正常安装固件和驱动,或释放被挂载的NPU。 检查docker是否安装。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。 yum install

    来自:帮助中心

    查看更多 →

  • 准备镜像

    在每个实例节点上运行此命令可以看到总卡数 如出现错误,可能是机器上的NPU设备没有正常安装,或者NPU镜像被其他容器挂载。请先正常安装固件和驱动,或释放被挂载的NPU。 检查docker是否安装。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。 yum install

    来自:帮助中心

    查看更多 →

  • 准备镜像

    在每个实例节点上运行此命令可以看到总卡数 如出现错误,可能是机器上的NPU设备没有正常安装,或者NPU镜像被其他容器挂载。请先正常安装固件和驱动,或释放被挂载的NPU。 检查docker是否安装。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。 yum install

    来自:帮助中心

    查看更多 →

  • Docker上部署ABI

    Docker上部署ABI 制作Dockerfile Dockerfile是一个包含用于组合映像的命令的文本文档。可以使用在命令行中调用任何命令。 Docker通过读取Dockerfile中的指令自动生成映像。可以参照以下方式制作Dockerfile。 FROM centos:7 ENV

    来自:帮助中心

    查看更多 →

  • 基本概念

    基本概念 AI引擎 可支持用户进行机器学习、深度学习模型训练作业开发的框架,如Tensorflow、Spark MLlib、MXNet、PyTorch、华为自研AI框架MindSpore等。 数据集 某业务下具有相同数据格式的数据逻辑集合。 特征操作 特征操作主要是对数据集进行特征处理。

    来自:帮助中心

    查看更多 →

  • 调度策略

    调度策略 如何让多个Pod均匀部署到各个节点上? 如何避免节点上的某个容器被驱逐? 为什么Pod在节点不是均匀分布? 如何驱逐节点上的所有Pod? 如何查看Pod是否使用CPU绑核? 节点关机后Pod不重新调度 如何避免非GPU/NPU负载调度到GPU/NPU节点? 为什么Pod调度不到某个节点上?

    来自:帮助中心

    查看更多 →

  • NPU调度

    nodeSelector: accelerator/huawei-npu: ascend-310 containers: - name: container-0 image: nginx:perl resources:

    来自:帮助中心

    查看更多 →

  • CPU调度

    CPU调度 CPU管理策略 增强型CPU管理策略 父主题: 调度

    来自:帮助中心

    查看更多 →

  • GPU调度

    GPU调度 GPU调度概述 准备GPU资源 创建GPU应用 监控GPU资源 父主题: 管理本地集群

    来自:帮助中心

    查看更多 →

  • 准备镜像

    在每个实例节点上运行此命令可以看到总卡数 如出现错误,可能是机器上的NPU设备没有正常安装,或者NPU镜像被其他容器挂载。请先正常安装固件和驱动,或释放被挂载的NPU。 检查docker是否安装。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。 yum install

    来自:帮助中心

    查看更多 →

  • moondream2基于DevServer适配PyTorch NPU推理指导

    请参考DevServer资源开通,购买DevServer资源,并确保机器已开通,密码已获取,能通过SSH登录,不同机器之间网络互通。 当容器需要提供服务给多个用户,或者多个用户共享使用该容器时,应限制容器访问Openstack的管理地址(169.254.169.254),以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。

    来自:帮助中心

    查看更多 →

  • Yolov8基于DevServer适配MindSpore Lite推理指导(6.3.909)

    步骤一:准备环境 请参考DevServer资源开通,购买DevServer资源,并确保机器已开通,密码已获取,能通过SSH登录,不同机器之间网络互通。 购买DevServer资源时如果无可选资源规格,需要联系华为云技术支持申请开通。 当容器需要提供服务给多个用户,或者多个用户共享使

    来自:帮助中心

    查看更多 →

  • LLaVA模型基于DevServer适配PyTorch NPU预训练指导(6.3.906)

    Step1 检查环境 请参考DevServer资源开通,购买DevServer资源,并确保机器已开通,密码已获取,能通过SSH登录,不同机器之间网络互通。 购买DevServer资源时如果无可选资源规格,需要联系华为云技术支持申请开通。 当容器需要提供服务给多个用户,或者多个用户共享使

    来自:帮助中心

    查看更多 →

  • 非分离部署推理服务

    zip到主机中,包获取路径请参见表2。 将权重文件上传到DevServer机器中。权重文件的格式要求为Huggingface格式。开源权重文件获取地址请参见表3。 如果使用模型训练后的权重文件进行推理,模型训练及训练后的权重文件转换操作可以参考相关文档章节中提供的模型训练文档。 权重要求放在磁盘的指定目录,并做目录大小检查,参考命令如下。

    来自:帮助中心

    查看更多 →

  • 修订记录

    变换、优化模型训练、特征迁移增加迁移评估等,对应刷新JupyterLab开发平台。 模型训练新增创建联邦学习工程及其服务,对应新增创建联邦学习工程。 模型包支持对Jupyterlab环境归档的模型创建模型包、支持对特定模型包新建联邦学习实例、支持对已发布推理服务模型包更新发布推理服务,对应刷新模型管理。

    来自:帮助中心

    查看更多 →

  • 准备镜像环境

    在每个实例节点上运行此命令可以看到总卡数 如出现错误,可能是机器上的NPU设备没有正常安装,或者NPU镜像被其他容器挂载。请先正常安装NPU设备和驱动,或释放被挂载的NPU。 检查docker是否安装。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。 yum install

    来自:帮助中心

    查看更多 →

  • SDXL基于DevServer适配PyTorch NPU的Finetune训练指导(6.3.905)

    Step1 检查环境 请参考DevServer资源开通,购买DevServer资源,并确保机器已开通,密码已获取,能通过SSH登录,不同机器之间网络互通。 购买DevServer资源时如果无可选资源规格,需要联系华为云技术支持申请开通。 当容器需要提供服务给多个用户,或者多个用户共享使

    来自:帮助中心

    查看更多 →

  • 数据调度

    数据调度 调度管理 调度管理为离线任务部署管理页面,所有离线订单的部署任务汇总调度维护。部署任务订单状态成功,失败,并可以查看历史调度和操作日志。 图1 调度管理-1 图2 调度管理-2 启动:任务状态为停止方可启动,默认置灰不可选 停止:运行状态才可以停止,默认置灰不可选 重新

    来自:帮助中心

    查看更多 →

  • 调度统计

    用于统计CPU的一些调度信息,包括idle任务启动时间、idle任务运行时长、调度切次数等。OsShellStatisticsStart---调度统计功能开启函数。OsShellStatisticsStop---调度统计功能关闭函数。关闭后,会自动调用OsStatisticsShow输出调度统计信息。OsShellCmdDumpSched

    来自:帮助中心

    查看更多 →

  • 调度策略

    调度策略 污点和容忍策略 负载亲和调度策略 节点亲和调度策略 父主题: 网关工作负载

    来自:帮助中心

    查看更多 →

  • 调度策略

    调度策略 操作场景 如果您需要将指定设备连接至特定区域的云服务器,请参考本节内容,管理设备对不同区域云服务器的调度策略。 在设备连接云服务器时,VR云渲游平台将根据用户设置的调度策略分配调度区域内的闲置云服务器。 查看设备的调度策略 登录控制台,在服务列表中选择“计算 > VR云渲游平台”。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了