弹性云服务器 ECS

 

弹性云服务器(Elastic Cloud Server)是一种可随时自助获取、可弹性伸缩的云服务器,帮助用户打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率

 
 

    量化交易 云服务器 更多内容
  • 使用GPTQ量化

    使用GPTQ量化 当前版本使用GPTQ量化仅支持W8A16 perchannel的量化形式,使用W8A16的量化不仅可以保证精度在可接受的范围内,同时也有一定的性能收益。 GPTQ W8A16量化支持的模型请参见表3。 本章节介绍如何在GPU的机器上使用开源GPTQ量化工具GPTQ

    来自:帮助中心

    查看更多 →

  • 使用AWQ量化

    使用AWQ量化 AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。 本章节介绍如何使用AWQ量化工具实现推理量化量化方法:W4A16 per-group/per-channel,W8A16

    来自:帮助中心

    查看更多 →

  • 使用GPTQ量化

    使用GPTQ量化 当前版本使用GPTQ量化仅支持W8A16 perchannel的量化形式,使用W8A16的量化不仅可以保证精度在可接受的范围内,同时也有一定的性能收益。 GPTQ W8A16量化支持的模型请参见支持的模型列表和权重文件。 本章节介绍如何在GPU的机器上使用开源GPTQ量化工具GPTQ

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化 使用SmoothQuant量化 使用kv-cache-int8量化 使用GPTQ量化 使用llm-compressor工具量化 父主题: 主流开源大模型基于Server适配PyTorch NPU推理指导(6.3.911)

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化工具转换权重 使用SmoothQuant量化工具转换权重 使用kv-cache-int8量化 使用GPTQ量化 父主题: 主流开源大模型基于Standard适配PyTorch NPU推理指导(6.3.911)

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化工具转换权重 使用SmoothQuant量化工具转换权重 使用kv-cache-int8量化 父主题: 主流开源大模型基于Standard适配PyTorch NPU推理指导(6.3.907)

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化工具转换权重 使用SmoothQuant量化工具转换权重 使用kv-cache-int8量化 父主题: 主流开源大模型基于Standard适配PyTorch NPU推理指导(6.3.906)

    来自:帮助中心

    查看更多 →

  • 使用SmoothQuant量化

    --per-token:激活值量化方法,若指定则为per-token粒度量化,否则为per-tensor粒度量化。 --per-channel:权重量化方法,若指定则为per-channel粒度量化,否则为per-tensor粒度量化。 启动smoothQuant量化服务。 参考部署推理服务,使用量化后权重部署AWQ量化服务。

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化 使用SmoothQuant量化 使用kv-cache-int8量化 使用GPTQ量化 父主题: 主流开源大模型基于DevServer适配PyTorch NPU推理指导(6.3.908)

    来自:帮助中心

    查看更多 →

  • 使用SmoothQuant量化

    --per-token:激活值量化方法,如果指定则为per-token粒度量化,否则为per-tensor粒度量化。 --per-channel:权重量化方法,如果指定则为per-channel粒度量化,否则为per-tensor粒度量化。 启动smoothQuant量化服务。 参考部署推理

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化工具转换权重 使用SmoothQuant量化工具转换权重 使用kv-cache-int8量化 使用GPTQ量化 父主题: 主流开源大模型基于Standard适配PyTorch NPU推理指导(6.3.910)

    来自:帮助中心

    查看更多 →

  • 使用SmoothQuant量化

    --per-token:激活值量化方法,如果指定则为per-token粒度量化,否则为per-tensor粒度量化。 --per-channel:权重量化方法,如果指定则为per-channel粒度量化,否则为per-tensor粒度量化。 启动smoothQuant量化服务。 参考Step6

    来自:帮助中心

    查看更多 →

  • 利用合约发送交易

    利用合约发送交易 合约调用信息构建。 接口方法 ContractRawMessage.class public RawMessage buildInvokeRawMsg(String chainId, String name, String function, String[] args)

    来自:帮助中心

    查看更多 →

  • 查询交易执行结果

    类型 说明 chainId String 链名称。 txHash byte[] 交易哈希。 返回值 类型 说明 RawMessage 根据交易ID查询交易执行结果需发送的消息。 消息发送。 接口方法 QueryAction.class public ListenableFuture<RawMessage>

    来自:帮助中心

    查看更多 →

  • 利用合约发送交易

    RawMessage 背书请求返回结果集合。 返回值 类型 说明 *TxRawMsg 包含交易hash的交易请求信息,该消息使用transaction接口发送。 error 构建成功返回类型为nil,反之返回error。 交易消息发送。 接口方法 func (action *ContractAction)

    来自:帮助中心

    查看更多 →

  • 查询交易执行结果

    chainID string 链名称。 txHash []byte 交易Hash。 返回值 类型 说明 *common.RawMessage 查询交易执行结果需发送的消息。 error 构建成功返回类型为nil,反之返回error。 消息发送。 接口方法 QueryAction.class

    来自:帮助中心

    查看更多 →

  • 利用合约发送交易

    利用合约发送交易 合约调用信息构建。 接口方法 ContractRawMessage.class public RawMessage buildInvokeRawMsg(String chainId, String name, String function, String[] args)

    来自:帮助中心

    查看更多 →

  • 查询交易执行结果

    类型 说明 chainId String 链ID。 txHash byte[] 交易哈希。 返回值 类型 说明 RawMessage 消息体,用于查询交易执行结果。 消息发送。 接口方法 QueryAction.class public ListenableFuture<RawMessage>

    来自:帮助中心

    查看更多 →

  • 查询交易执行结果

    chainID string 链ID。 txHash []byte 交易Hash。 返回值 类型 说明 *common.RawMessage 查询交易执行结果需发送的消息。 error 构建成功返回类型为nil,反之返回error。 消息发送。 接口方法 QueryAction.class

    来自:帮助中心

    查看更多 →

  • 查询区块、交易统计结果

    查询区块、交易统计结果 功能介绍 查询区块、交易统计结果,只支持云端管理实例使用 URI GET /v2/{project_id}/huaweicloudchain/instances/{instance_id}/chain/trend 表1 路径参数 参数 是否必选 参数类型 描述

    来自:帮助中心

    查看更多 →

  • 什么是组合交易单?

    什么是组合交易单? 组合交易订单:多个云服务实例一同交易生成组合交易订单。“一同交易”包括多个云服务组合购买、批量续费、批量变更、批量退订、批量按需转包年包月等场景。组合交易订单下的各个实例必须一同支付或取消,支付完成后,各个云服务后续可单独进行交易。 组合交易订单展示组合名称、组合类型,以及其下各个订单的详情信息。

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了