开通预置服务

MaaS预置服务为企业用户提供高性能、高可用的推理API服务，支持按Token用量计费的模式。该服务适用于需要商用级稳定性、更高调用频次和专业支持的场景。

企业智能客服：企业希望利用推理API优化客服系统，实现智能问答、意图识别，提升客服效率与客户满意度。
内容创作辅助：媒体、广告公司借助推理API进行文案创作、创意生成，提高内容产出的效率与质量。
智能数据分析：金融、电商企业通过推理API对海量数据深度分析，挖掘数据价值，辅助决策制定。

约束限制

该功能仅支持“西南-贵阳一”区域。
开通预置服务时，将自动开通该服务下所有版本，不支持单独开通某版本。
暂不支持关闭预置服务。

计费说明

在调用模型推理服务的过程中，输入内容首先会被分词（tokenize），转换为模型可识别的Token。在调用MaaS预置服务时，将根据实际使用的Tokens数量进行计费。详细信息，请参见推理服务计费项。

优惠券说明

当有优惠折扣时，预置服务页签会出现相关提示。开通预置服务时，会默认领取可用的优惠券。在扣费时，会优先抵扣优惠券。
不同优惠券活动的适用范围和领取条件各不相同，能否成功领取请以实际活动规则为准。
模型服务的优惠折扣的发放和使用情况，请前往“费用中心 > 优惠折扣 >优惠券”进行查看。

服务调用说明

请求可能会根据实际情况路由到其他区域实例。

开通预置服务

登录MaaS控制台，在顶部导航栏中选择目标区域。
在左侧导航栏，选择“模型推理 > 在线推理”。
在“预置服务”页签，在目标服务右侧的“操作”列，单击“开通服务”。

在开通预置模型服务对话框，按需勾选预置服务，勾选“我已阅读并同意上述说明，及《MaaS 服务声明》”，单击“一键开通”。

勾选目标预置服务后，会自动开通该服务下的所有模型版本。

已开通的预置服务示例如下。预置服务列表的参数说明请参见下表。

图1 已开通预置服务
点击放大

表1 预置服务列表参数说明
参数	说明
服务名称/资源ID	预置服务的名称和ID。查看服务的版本和model参数：在服务名称左侧单击图标，可以查看该服务的版本。“model参数”列显示的名称可用于模型调用时使用，即model参数的值。图2 查看服务版本单击版本名称，将跳转至“模型详情”页面，您可以查看模型版本的详细信息。查看服务的账单：在预置服务ID后，单击图标复制ID，在费用中心的“账单管理 > 流水和明细账单”页面的“明细账单”页签，通过资源ID查看账单详情。
付费状态	开通：已开通预置服务。未开通：未开通预置服务。
类型	预置服务的类型。
计费方式	预置服务的计费方式，不同模型的计费方式可能不同，请以实际环境为准。更多信息，请参见推理服务计费项。
推理定价	预置服务的推理定价，不同模型的推理定价可能不同，请以实际环境为准。更多信息，请参见推理服务计费项。在页面右上角，您可以按需打开/关闭“百万tokens单位展示”。图3 百万tokens单位展示关闭“百万tokens单位展示”：将按照千tokens为单位展示定价。图4 千tokens单位示例打开“百万tokens单位展示”：将按照百万tokens为单位展示定价。图5 百万tokens单位示例
优惠折扣	预置服务已有的优惠折扣，“--”表示没有优惠，请以实际环境为准。
模型限流	当前账号下，访问同一模型下所有服务的总额度。 TPM：每分钟处理的Tokens数（输入+输出）。 RPM：每分钟处理的请求数。
调用统计	单击图标，跳转至“服务调用详情”页面，查看预置服务在指定时间段内的调用数据和监控指标详情。更多信息，请参见在MaaS查看在线推理的调用数据和监控指标。
操作	预置服务支持的相关操作。关闭服务：该按钮置灰，表示暂不支持关闭服务，未使用服务时不会产生费用。调用说明：参见调用预置服务。在线体验：参见在线体验预置服务。内容安全护栏：仅客户等级为V2及以上，支持开启或关闭内容安全护栏。开通预置服务后，内容安全护栏默认开启。关于客户等级的更多信息，请参见客户等级体系和如何查看客户等级。在模型推理链路中，开启内容安全护栏，提供额外拦截输入输出有害内容的能力，可能导致时延增加；不开启则使用模型原生安全能力。开启内容安全护栏：单击“更多 > 开启内容安全护栏”，在“开启内容安全护栏”对话框，阅读开启须知，单击“确定”。关闭内容安全护栏，单击“更多 > 关闭内容安全护栏”，在“关闭内容安全护栏”对话框，阅读关闭须知，勾选“我已阅读并同意上述说明，及《内容审核免责声明》”，单击“确定”。