文档首页/ AI开发平台ModelArts/ ModelArts Studio(MaaS)用户指南/ ModelArts Studio(MaaS)使用场景和使用流程
更新时间:2025-09-28 GMT+08:00

ModelArts Studio(MaaS)使用场景和使用流程

ModelArts Studio大模型即服务平台(后续简称为MaaS服务),提供端到端的大模型生产工具链和算力资源,并预置了当前主流的第三方开源大模型。用户可以基于MaaS平台开箱即用,对预置大模型进行二次开发,用于生产商用。

背景介绍

近年来,AI大模型凭借强大的自然语言理解、内容生成和决策辅助能力,正在成为企业数字化转型的重要推动力。越来越多的企业希望借助大模型优化业务流程,例如智能客服、数据分析、自动化报告生成等。然而,企业在尝试自主训练或微调大模型时,通常面临三大核心挑战:高昂的算力成本、复杂的技术门槛以及业务系统集成难题。由于大多数企业缺乏专业的AI团队,从零开始构建和优化模型变得异常困难,这直接导致了AI应用落地效率低下甚至项目失败。

针对这些痛点,MaaS提供了一站式解决方案:

  • 工具链:提供可视化训练平台,降低技术门槛,使企业无需深厚AI背景即可完成模型定制。
  • 资源共享:通过云端算力共享和预训练模型复用,帮助企业避免重复投资,显著降低算力成本。
  • 场景化适配:基于行业需求提供预置模型模板,加速企业AI应用的落地部署。

应用场景

ModelArts Studio大模型即服务平台(MaaS)的应用场景:

  • 业界主流开源大模型覆盖全

    MaaS集成了业界主流开源大模型,含Qwen、DeepSeek等模型系列,所有的模型进行全面适配和优化,使得精度和性能显著提升。开发者无需从零开始构建模型,只需选择合适的预训练模型直接应用,减轻模型集成的负担。

  • 资源易获取,按需收费,按需扩缩,支撑故障快恢与断点续训

    企业在具体使用大模型接入企业应用系统的时候,不仅要考虑模型体验情况,还需要考虑模型具体的精度效果,和实际应用成本。

    MaaS提供灵活的模型开发能力,提供了若干保障客户商业应用的关键能力。

    保障客户系统应用大模型的成本效率,按需收费,按需扩缩的灵活成本效益资源配置方案,有效避免了资源闲置与浪费,降低了进入AI领域的门槛。

    架构强调高可用性,多数据中心部署确保数据与任务备份,即使遭遇故障,也能无缝切换至备用系统,维持模型训练不中断,保护长期项目免受时间与资源损耗,确保进展与收益。

  • 大模型应用开发,帮助开发者快速构建应用

    在企业中,项目级复杂任务通常需要理解任务并拆解成多个问题再进行决策,然后调用多个子系统去执行。MaaS基于多个优质开源大模型,让大模型准确理解业务意图,分解复杂任务,沉淀出丰富的解决方案,帮助企业快速智能构建和部署大模型应用。

支持区域

仅中国-香港区域支持使用MaaS。

使用流程

下表展示了MaaS的核心使用流程。

表1 MaaS使用流程

模块

操作

说明

相关文档

授权

配置访问授权

对于所有用户(包括个人用户),需要完成ModelArts委托授权才能使用MaaS服务,否则会造成您的操作出现不可预期的错误。

在线推理服务

查看模型广场的预置模型

ModelArts Studio大模型即服务平台提供了丰富的开源大模型,在“模型广场”页面可以查看。模型详情页可以查看模型的详细介绍,根据这些信息选择合适的模型进行推理,接入到企业解决方案中。

在ModelArts Studio(MaaS)模型广场查看预置模型

开通预置服务的商用服务

MaaS预置服务的商用服务为企业用户提供高性能、高可用的推理API服务,支持按Token用量计费的模式。该服务适用于需要商用级稳定性、更高调用频次和专业支持的场景。

在ModelArts Studio(MaaS)预置服务中开通商用服务

部署模型服务

ModelArts Studio大模型即服务平台支持将模型广场的预置模型部署到计算资源上,便于在其他业务环境中调用该模型。

使用ModelArts Studio(MaaS)部署模型服务

API调用

调用模型服务

在ModelArts Studio大模型即服务平台完成模型部署后,可以在其他业务环境中调用该模型服务进行预测。

调用ModelArts Studio(MaaS)部署的模型服务

模型管理

创建模型

ModelArts Studio提供了开源大模型,您可以使用这些基础模型,结合自定义的模型权重文件,创建个人专属的模型。创建成功的模型可以进行推理等操作。

在ModelArts Studio(MaaS)创建模型

管理与统计

查看服务的调用数据和监控指标

MaaS提供调用统计功能,支持查看我的服务、预置服务的商用服务在指定时间段内的调用数据和监控指标详情,包括总调用次数、总调用失败次数、调用总Tokens数、输入Tokens数、输出Tokens数、平均响应时延等信息,并以分钟为最小时间粒度展示数据趋势,帮助您了解服务的使用情况和性能变化,从而更有效地进行模型评估、问题定位、故障排除和性能优化。

查看ModelArts Studio(MaaS)调用数据和监控指标