自助服务

华为云自助服务为用户提供产品常见问题,自助工具,便捷服务入口,帮助您更加方便、快捷的使用云服务

    规则推理引擎工具 更多内容
  • 在推理生产环境中部署推理服务

    推理生产环境中部署推理服务 本章节介绍如何在ModelArts的推理生产环境(ModelArts控制台的在线服务功能)中部署推理服务。 Step1 准备模型文件和权重文件 在OBS桶中,创建文件夹,准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。

    来自:帮助中心

    查看更多 →

  • 推理服务接口

    推理服务接口 发起调用请求 父主题: fabric-ep

    来自:帮助中心

    查看更多 →

  • 推理精度测试

    推理精度测试 本章节介绍如何进行推理精度测试,请在Notebook的JupyterLab中另起一个Terminal,进行推理精度测试。 Step1 配置精度测试环境 获取精度测试代码。精度测试代码存放在代码包AscendCloud-LLM的llm_tools/llm_evaluation目录中,代码目录结构如下。

    来自:帮助中心

    查看更多 →

  • 推理场景介绍

    推理场景介绍 方案概览 本方案介绍了在ModelArts Lite DevServer上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬

    来自:帮助中心

    查看更多 →

  • 部署推理服务

    ipv4.ip_forward Step2 获取推理镜像 建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表2。 docker pull {image_url} Step3 上传代码包和权重文件 上传安装依赖软件推理代码AscendCloud-3rdLLM-xxx

    来自:帮助中心

    查看更多 →

  • 部署推理服务

    odel入参同系列,但是权重参数远小于--model指定的模型。若未使用投机推理功能,则无需配置。 --num-speculative-tokens:投机推理小模型每次推理的token数。若未使用投机推理功能,则无需配置。参数--num-speculative-tokens需要和--speculative-model

    来自:帮助中心

    查看更多 →

  • 推理场景介绍

    ├── build_image.sh # 推理构建镜像启动脚本 ├──llm_tools # 推理工具包 ├──AutoSmoothQuant # W8A8量化工具 ├── ascend_autosmoothquant_adapter

    来自:帮助中心

    查看更多 →

  • 推理精度测试

    里是ppl的配置项。由于离线执行推理,消耗的显存相当庞大。其中以下参数需要根据实际来调整。 batch_size, 推理时传入的 prompts 数量,可配合后面的参数适当减少 offline,是否启动离线模型,使用 ppl 时必须为 True tp_size,使用推理的卡数 max_seq

    来自:帮助中心

    查看更多 →

  • 部署推理服务

    odel入参同系列,但是权重参数远小于--model指定的模型。若未使用投机推理功能,则无需配置。 --num-speculative-tokens:投机推理小模型每次推理的token数。若未使用投机推理功能,则无需配置。参数--num-speculative-tokens需要和--speculative-model

    来自:帮助中心

    查看更多 →

  • 推理场景介绍

    ├── build_image.sh # 推理构建镜像启动脚本 ├──llm_tools # 推理工具包 ├──AutoSmoothQuant # W8A8量化工具 ├── ascend_autosmoothquant_adapter

    来自:帮助中心

    查看更多 →

  • 部署推理服务

    部署推理服务 非分离部署推理服务 分离部署推理服务 父主题: 主流开源大模型基于DevServer适配PyTorch NPU推理指导(6.3.908)

    来自:帮助中心

    查看更多 →

  • 部署推理服务

    部署推理服务 非分离部署推理服务 分离部署推理服务 父主题: 主流开源大模型基于Server适配PyTorch NPU推理指导(6.3.910)

    来自:帮助中心

    查看更多 →

  • 推理场景介绍

    推理场景介绍 方案概览 本方案介绍了在ModelArts的Lite k8s Cluster上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9

    来自:帮助中心

    查看更多 →

  • 部署推理服务

    部署推理服务 非分离部署推理服务 分离部署推理服务 父主题: 主流开源大模型基于Server适配PyTorch NPU推理指导(6.3.911)

    来自:帮助中心

    查看更多 →

  • 推理精度测试

    推理精度测试 本章节介绍如何使用lm-eval工具开展语言模型的推理精度测试,数据集包含mmlu、ARC_Challenge、GSM_8k、Hellaswag、Winogrande、TruthfulQA等。 约束限制 确保容器可以访问公网。 当前的精度测试仅适用于语言模型精度验证

    来自:帮助中心

    查看更多 →

  • 工具接口

    工具接口 创建图片Metadata 配置并切换用户 导入用户证书秘钥并切换用户 生成私钥和证书 生成数字资产标识 生成数字资产编码 父主题: Java

    来自:帮助中心

    查看更多 →

  • 工具接口

    工具接口 创建图片Metadata 配置并切换用户 导入用户证书秘钥并切换用户 生成私钥和证书 生成数字资产标识 生成数字资产编码 父主题: PHP

    来自:帮助中心

    查看更多 →

  • 工具中心

    工具中心 管理用户组 父主题: 普通用户指南

    来自:帮助中心

    查看更多 →

  • 工具平台

    工具平台 API生产阶段 API中心通过对接集成,为API开发者提供API Arts等自动化的API设计/开发/测试工具,开发者通过华为云账号登录后即可使用。 API开放阶段 API开发者(API提供方)可以在API中心申请入驻为服务商,然后自助发布上架API。上架成功后,API

    来自:帮助中心

    查看更多 →

  • 工具管理

    et。 添加私有工具 您使用的工具如果不在G CS 提供的公共工具中(公共工具的范围请参见公共工具的范围),您可以通过添加私有工具,使用自定义工具。 如要使用自有工具镜像,添加私有工具前,您需要前往 容器镜像服务 SWR上传镜像。 登录GCS控制台,选择左侧导航栏的“工具仓库”,在右侧页面单击“添加工具”。

    来自:帮助中心

    查看更多 →

  • 工具类

    工具类 毕昇编译器 应用加速工具 Pod带宽管理工具 安全加固工具

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了