在ModelArts Studio(MaaS)预置服务中开通商用服务
MaaS预置服务的商用服务为企业用户提供高性能、高可用的推理API服务,支持按Token用量计费的模式。该服务适用于需要商用级稳定性、更高调用频次和专业支持的场景。
场景描述
- 企业智能客服:企业希望利用推理API优化客服系统,实现智能问答、意图识别,提升客服效率与客户满意度。
- 内容创作辅助:媒体、广告公司借助推理API进行文案创作、创意生成,提高内容产出的效率与质量。
- 智能数据分析:金融、电商企业通过推理API对海量数据深度分析,挖掘数据价值,辅助决策制定。
免费服务与商用服务的区别
- 免费服务:仅提供基础体验能力,且存在严格的速率限制。平台可能会不定期调整其适用模型、免费额度、有效期等内容,请以实际环境为准。免费服务仅适用于体验模型。
- 商用服务:提供商用级别的API推理服务,开通后您可以获取付费API服务。商用服务适用于需要商用级稳定性、更高调用频次和专业支持的场景。
约束限制
- 开通商用服务时,将自动开通该服务下所有版本,不支持单独开通某版本。
- 暂不支持关闭商用服务。
计费说明
在调用模型推理服务的过程中,输入内容首先会被分词(tokenize),转换为模型可识别的Token。在调用MaaS预置服务时,将根据实际使用的Tokens数量进行计费。详细信息,请参见MaaS模型推理计费项。
优惠券说明
- 当有优惠折扣时,预置服务的商用服务页签会出现相关提示。开通商用服务时,会默认领取可用的优惠券。在扣费时,会优先抵扣优惠券。
- 不同优惠券活动的适用范围和领取条件各不相同,能否成功领取请以实际活动规则为准。
- 模型服务的优惠折扣的发放和使用情况,请前往 进行查看。
服务调用说明
请求可能会根据实际情况路由到其他区域实例。
开通商用服务
- 登录ModelArts Studio(MaaS)控制台,在顶部导航栏选择目标区域。
- 在左侧导航栏,选择“在线推理”。
- 在“操作”列,单击“开通服务”。 页签,在目标服务右侧的
- 在开通预置模型服务对话框,按需勾选商用服务(默认全选),勾选“我已阅读并同意上述说明,及《ModelArts Studio 服务声明》”,单击“一键开通”。
勾选目标商用服务后,会自动开通该服务下的所有模型版本。
图1 开通预置模型服务已开通的商用服务示例如下。商用服务列表的参数说明请参见下表。
图2 已开通商用服务表1 商用服务列表参数说明 参数
说明
服务名称
商用服务的名称。在服务名称左侧单击
图标,可以查看该服务的版本。“model参数”列显示的名称可用于模型调用时使用,即model参数的值。
图3 查看服务版本付费状态
- 开通:已开通商用服务。
- 未开通:未开通商用服务。
类型
商用服务的类型。
计费方式
商用服务的计费方式,不同模型的计费方式可能不同,请以实际环境为准。更多信息,请参见计费项(ModelArts Studio)。
推理定价
商用服务的推理定价,不同模型的推理定价可能不同,请以实际环境为准。更多信息,请参见计费项(ModelArts Studio)。
优惠折扣
商用服务已有的优惠折扣,“--”表示没有优惠,请以实际环境为准。
模型限流
当前账号下,访问同一模型下所有服务的总额度。
- TPM:每分钟处理的Tokens数(输入+输出)。
- RPM:每分钟处理的请求数。
调用统计
单击
图标,跳转至“服务调用详情”页面,查看商用服务在指定时间段内的调用数据和监控指标详情。更多信息,请参见在ModelArts Studio(MaaS)查看在线推理的调用数据和监控指标。
操作
商用服务支持的相关操作。
- 关闭服务:该按钮置灰,表示暂不支持关闭服务,未使用服务时不会产生费用。
- 调用说明:单击“调用说明”,选择服务版本,在“调用说明”面板查看调用商用服务的相关信息和操作步骤。更多信息,请参见调用ModelArts Studio(MaaS)部署的模型服务。
- 在线体验:单击“在线体验”,选择服务版本,跳转至模型对应的体验页面,进行在线体验。更多信息,请参见ModelArts Studio(MaaS)在线体验。
欠费说明
当您使用某个模型服务欠费后,对应资源实例不会立即停止服务,资源进入宽限期。您需支付按需资源在宽限期内产生的费用,相关费用可在管理控制台 > 费用中心 > 总览“欠费金额”查看,华为云将在您充值时自动扣取欠费金额。此时不会冻结资源, 只会影响用户开通新资源、开通新服务。 已有资源可正常使用。
如果您在宽限期内仍未支付欠款,特定资源会触发欠费冻结,进入保留期,资源状态变为“已冻结”。此时欠费冻结的资源不可使用,未开通的模型不支持再开通。
保留期到期后,如果您仍未支付账户欠款,那么您账号名下此模型相关资源和订单记录会被清理,数据无法恢复。对应模型的付费状态变为未开通。
欠费后请您及时充值,详细操作请参见账户充值。

常见问题
- 有计费示例吗?
计费项和计费示例请参考MaaS模型推理计费项。
- 开通付费服务后,可以关闭吗?
- 使用商用服务,模型状态显示冻结,如何处理?
此时欠费冻结的资源不可使用,未开通的模型不支持再开通。您可以通过充值进行解冻,被冻结的资源实例将恢复使用,未开通的模型将支持开通。详细操作请参见账户充值。
- 如果模型服务的RPM数值为300,可以1秒直接发送300个请求吗?
不可以。如果模型服务的RPM(每分钟请求数)为300,意味着每秒最多可以处理5个请求(300/60=5)。因此,1秒内发送300个请求会远远超出服务的处理能力,导致请求失败。
建议您均匀地发送API请求,避免短时间内发送大量请求。根据API网关的限流机制,如果1秒内的请求数超过RPM/60*1,超额部分的请求可能会触发API网关的速率限制拦截,导致请求失败并返回错误码429(Too Many Requests)。