自助服务

华为云自助服务为用户提供产品常见问题,自助工具,便捷服务入口,帮助您更加方便、快捷的使用云服务

    区块链量化工具 更多内容
  • 工具库

    工具库 防盗地址生成

    来自:帮助中心

    查看更多 →

  • 工具库

    工具库 获取频道回看或时移地址 父主题: 控制台操作

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化 使用SmoothQuant量化 使用kv-cache-int8量化 使用GPTQ量化 父主题: 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导(6.3.911)

    来自:帮助中心

    查看更多 →

  • 使用SmoothQuant量化

    --per-token:激活值量化方法,如果指定则为per-token粒度量化,否则为per-tensor粒度量化。 --per-channel:权重量化方法,如果指定则为per-channel粒度量化,否则为per-tensor粒度量化。 启动smoothQuant量化服务。 参考Step6

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化 使用SmoothQuant量化 使用kv-cache-int8量化 使用GPTQ量化 使用llm-compressor工具量化 父主题: 主流开源大模型基于Lite Server适配PyTorch NPU推理指导(6.3.909)

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化 使用SmoothQuant量化 使用kv-cache-int8量化 使用GPTQ量化 父主题: 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导(6.3.910)

    来自:帮助中心

    查看更多 →

  • 使用SmoothQuant量化

    --per-token:激活值量化方法,如果指定则为per-token粒度量化,否则为per-tensor粒度量化。 --per-channel:权重量化方法,如果指定则为per-channel粒度量化,否则为per-tensor粒度量化。 启动smoothQuant量化服务。 参考步骤六

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化 使用SmoothQuant量化 使用kv-cache-int8量化 父主题: 主流开源大模型基于Lite Server适配PyTorch NPU推理指导(6.3.906)

    来自:帮助中心

    查看更多 →

  • 工具概述

    工具概述 x2hce-ca是华为云对系统迁移提供的一款免费的应用兼容性评估工具。x2hce-ca通过对待迁移应用进行快速扫描分析,帮助您评估应用在源操作系统和目标操作系统的兼容性。 表1 支持兼容性评估的x86公共镜像 OS发行系列 源操作系统 目标操作系统 HCE 64bit:Huawei

    来自:帮助中心

    查看更多 →

  • 工具对接

    工具对接 JDBC配置 父主题: 开发设计建议

    来自:帮助中心

    查看更多 →

  • 建模工具

    建模工具 ID生成器定义 数据字典管理 类别配置管理 标签模板定义 动态属性扩展实体配置 动态属性扩展属性配置 单位管理 父主题: 制造数据模型管理

    来自:帮助中心

    查看更多 →

  • 工具对接

    工具对接 JDBC配置 父主题: 开发设计建议

    来自:帮助中心

    查看更多 →

  • 工具准备

    工具准备 需要准备的工具如表1所示。 qemu-img-hw工具和VNC工具仅在第二种方式(即使用物理机virt-manager工具制作镜像)下需要。 表1 工具列表 名称 说明 获取路径 跨平台远程访问工具 制作镜像过程中,用于访问宿主机的工具,如“Xshell”。 建议从官方网站获取。

    来自:帮助中心

    查看更多 →

  • 工具简介

    工具简介 本手册介绍 数据仓库 服务的工具使用,提供了客户端工具和服务端工具,客户端工具如表1所示,服务端工具如表2所示。 客户端工具:参见工具下载获取。 服务端工具:位于安装数据库 服务器 的$GPHOME/script和$GAUSSHOME/bin路径下。 表1 客户端工具 工具名称

    来自:帮助中心

    查看更多 →

  • 工具中心

    工具中心 管理用户组 父主题: 用户中心界面一览

    来自:帮助中心

    查看更多 →

  • 订购区块链实例

    弹性IP带宽 5 Mbit/s 单击“下一步: 区块链 配置”,进行区块链配置,参数如表3所示。 表3 区块链配置 参数 说明 区块链配置 自定义配置。 区块链管理初始密码 如果填写该项,则以填写值为准,如果不填写,则以资源初始密码为准。 区块链管理确认密码 - 存储卷类型 文件存储卷。

    来自:帮助中心

    查看更多 →

  • W8A8量化

    对称量化。 权重量化支持per-channel,支持非对称量化。 Deepseek-v2系列模型的W8A8量化需要使用llm-compressor工具。 SmoothQuant量化模型 本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具

    来自:帮助中心

    查看更多 →

  • 使用kv-cache-int8量化

    和权重文件。 本章节介绍如何在Notebook使用tensorRT量化工具实现推理量化。 Step1使用tensorRT量化工具进行模型量化 在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化工具下载使用指导请参见https://github.com/NVIDI

    来自:帮助中心

    查看更多 →

  • 使用kv-cache-int8量化

    。 本章节介绍如何在Notebook使用tensorRT量化工具实现推理量化。 Step1使用tensorRT量化工具进行模型量化 使用tensorRT 0.9.0版本工具进行模型量化工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0

    来自:帮助中心

    查看更多 →

  • 使用kv-cache-int8量化

    和权重文件。 本章节介绍如何在Notebook使用tensorRT量化工具实现推理量化。 Step1使用tensorRT量化工具进行模型量化 在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化工具下载使用指导请参见https://github.com/NVIDI

    来自:帮助中心

    查看更多 →

  • 向量化执行引擎

    量化执行引擎 GS_232010001 错误码: [SonicHashJoin]: The memory of the current statement is not controlled. 解决方案:请设置hashjoin_spill_strategy为0-2。 level:

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了