致远互联协同管理解决方案

致远互联协同管理解决方案

伙伴方案
公有云/HCSO/HCS

    机器学习随机控制量化 更多内容
  • 给用户重置随机密码

    给用户重置随机密码 功能介绍 该接口用于给用户重置一个密码。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/users/{u

    来自:帮助中心

    查看更多 →

  • 轻量化模型卡片

    单击“保存”。 使用轻量化模型卡片 已添加“轻量化模型”卡片到角色桌面,并且已上传文件进行轻量化转换。如果您还没有进行轻量化转换,卡片内容为空。 您可以参见轻量化模型转换API,调用相应的API上传待轻量化转换的文件,查询轻量化转换的任务和下载轻量化文件。 在卡片左侧的列表中选择待查看

    来自:帮助中心

    查看更多 →

  • 使用SmoothQuant量化

    --per-token:激活值量化方法,如果指定则为per-token粒度量化,否则为per-tensor粒度量化。 --per-channel:权重量化方法,如果指定则为per-channel粒度量化,否则为per-tensor粒度量化。 启动smoothQuant量化服务。 参考Step6

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化 使用SmoothQuant量化 使用kv-cache-int8量化 使用GPTQ量化 使用llm-compressor工具量化 父主题: 主流开源大模型基于DevServer适配PyTorch NPU推理指导(6.3.909)

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化 使用SmoothQuant量化 使用kv-cache-int8量化 父主题: 主流开源大模型基于DevServer适配PyTorch NPU推理指导(6.3.906)

    来自:帮助中心

    查看更多 →

  • 课程学习

    课程学习 前提条件 用户具有课程发布权限 操作步骤-电脑端 登录ISDP系统,选择“作业人员->学习管理->我的学习”并进入,查看当前可以学习的课程。 图1 我的学习入口 在“我的学习”的页面,点击每个具体的课程卡片,进入课程详情页面。可以按学习状态(未完成/已完成)、学习类型(

    来自:帮助中心

    查看更多 →

  • 下载轻量化文件

    下载轻量化文件 功能介绍 下载轻量化文件 文件轻量化完成后,会以目录文件夹的形式存储在系统中,通过查询轻量化任务状态能够获取到轻量化文件的存储目录,即属性lightweight_file_path的值。该目录下会存在大量的轻量化文件,这些文件信息会存储在该目录下的Configurations

    来自:帮助中心

    查看更多 →

  • 使用SmoothQuant量化

    --per-token:激活值量化方法,若指定则为per-token粒度量化,否则为per-tensor粒度量化。 --per-channel:权重量化方法,若指定则为per-channel粒度量化,否则为per-tensor粒度量化。 启动smoothQuant量化服务。 参考Step6

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化 使用SmoothQuant量化 使用kv-cache-int8量化 父主题: 主流开源大模型基于DevServer适配PyTorch NPU推理指导(6.3.907)

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化 使用SmoothQuant量化 使用kv-cache-int8量化 使用GPTQ量化 父主题: 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导(6.3.909)

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化工具转换权重 使用SmoothQuant量化工具转换权重 使用kv-cache-int8量化 使用GPTQ量化 父主题: 主流开源大模型基于Standard适配PyTorch NPU推理指导(6.3.908)

    来自:帮助中心

    查看更多 →

  • 使用SmoothQuant量化

    --per-token:激活值量化方法,若指定则为per-token粒度量化,否则为per-tensor粒度量化。 --per-channel:权重量化方法,若指定则为per-channel粒度量化,否则为per-tensor粒度量化。 启动smoothQuant量化服务。 参考步骤六

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化工具转换权重 使用SmoothQuant量化工具转换权重 使用kv-cache-int8量化 使用GPTQ量化 父主题: 主流开源大模型基于Standard适配PyTorch NPU推理指导(6.3.909)

    来自:帮助中心

    查看更多 →

  • 内容数据量化

    内容数据量化 SOW中搬迁资源量以及工作内容描述补充说明内容需数据量化。 父主题: SOW(项目工作说明书)注意事项

    来自:帮助中心

    查看更多 →

  • 控制

    控制 控制连接器包含“中断”“条件判断”“继续”“遍历集合元素”“分支”“数据分片”“多分支条件”“终止”“流程块”“循环”“异常监控和处理”执行动作。 连接参数 控制连接器无需认证,无连接参数。 中断 中断(break),设置了中断节点,流运行到中断节点后,不会再往后面执行,并

    来自:帮助中心

    查看更多 →

  • 控制

    控制 控制连接器包含“中断”、“条件判断”、“继续”、“遍历集合元素”、“分支”、“数据分片”、“多分支条件”、“终止”、“流程块”、“循环”、“异常监控和处理”执行动作。 连接参数 控制连接器无需认证,无连接参数。 中断 中断(break),设置了中断节点,流运行到中断节点后,

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化工具转换权重 使用SmoothQuant量化工具转换权重 使用kv-cache-int8量化 父主题: 主流开源大模型基于Standard适配PyTorch NPU推理指导(6.3.907)

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化工具转换权重 使用SmoothQuant量化工具转换权重 使用kv-cache-int8量化 父主题: 主流开源大模型基于Standard适配PyTorch NPU推理指导(6.3.906)

    来自:帮助中心

    查看更多 →

  • 使用SmoothQuant量化

    --per-token:激活值量化方法,如果指定则为per-token粒度量化,否则为per-tensor粒度量化。 --per-channel:权重量化方法,如果指定则为per-channel粒度量化,否则为per-tensor粒度量化。 启动smoothQuant量化服务。 参考Step6

    来自:帮助中心

    查看更多 →

  • 使用SmoothQuant量化

    --per-token:激活值量化方法,若指定则为per-token粒度量化,否则为per-tensor粒度量化。 --per-channel:权重量化方法,若指定则为per-channel粒度量化,否则为per-tensor粒度量化。 启动smoothQuant量化服务。 参考

    来自:帮助中心

    查看更多 →

  • 推理模型量化

    推理模型量化 使用AWQ量化 使用SmoothQuant量化 使用kv-cache-int8量化 使用GPTQ量化 父主题: 主流开源大模型基于DevServer适配PyTorch NPU推理指导(6.3.908)

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了