ModelArts Studio(MaaS)使用场景和使用流程
ModelArts Studio大模型即服务平台(后续简称为MaaS服务),提供端到端的大模型生产工具链和昇腾算力资源,并预置了当前主流的第三方开源大模型,支持大模型数据生产、微调、提示词工程、应用编排等功能。用户可以基于MaaS平台开箱即用,对预置大模型进行二次开发,用于生产商用。
背景介绍
近年来,AI大模型凭借强大的自然语言理解、内容生成和决策辅助能力,正在成为企业数字化转型的重要推动力。越来越多的企业希望借助大模型优化业务流程,例如智能客服、数据分析、自动化报告生成等。然而,企业在尝试自主训练或微调大模型时,通常面临三大核心挑战:高昂的算力成本、复杂的技术门槛以及业务系统集成难题。由于大多数企业缺乏专业的AI团队,从零开始构建和优化模型变得异常困难,这直接导致了AI应用落地效率低下甚至项目失败。
针对这些痛点,MaaS提供了一站式解决方案:
- 工具链:提供可视化训练平台,降低技术门槛,使企业无需深厚AI背景即可完成模型定制。
- 资源共享:通过云端算力共享和预训练模型复用,帮助企业避免重复投资,显著降低算力成本。
- 场景化适配:基于行业需求提供预置模型模板,加速企业AI应用的落地部署。
应用场景
ModelArts Studio大模型即服务平台(MaaS)的应用场景:
- 业界主流开源大模型覆盖全
MaaS集成了业界主流开源大模型,含Llama、Baichuan、Yi、Qwen、DeepSeek等模型系列,所有的模型均基于昇腾AI云服务进行全面适配和优化,使得精度和性能显著提升。开发者无需从零开始构建模型,只需选择合适的预训练模型进行微调或直接应用,减轻模型集成的负担。
- 零代码、免配置、免调优模型开发
平台结合与100+客户适配、调优开源大模型的行业实践经验,沉淀了大量适配昇腾和调优推理参数的最佳实践。通过为客户提供一键式训练、自动超参调优等能力,和高度自动化的参数配置机制,使得模型优化过程不再依赖于手动尝试,显著缩短了从模型开发到部署的周期,确保了模型在各类应用场景下的高性能表现,让客户能够更加聚焦于业务逻辑与创新应用的设计。
- 资源易获取,按需收费,按需扩缩,支撑故障快恢与断点续训
企业在具体使用大模型接入企业应用系统的时候,不仅要考虑模型体验情况,还需要考虑模型具体的精度效果,和实际应用成本。
MaaS提供灵活的模型开发能力,同时基于昇腾云的算力底座能力,提供了若干保障客户商业应用的关键能力。
保障客户系统应用大模型的成本效率,按需收费,按需扩缩的灵活成本效益资源配置方案,有效避免了资源闲置与浪费,降低了进入AI领域的门槛。
架构强调高可用性,多数据中心部署确保数据与任务备份,即使遭遇故障,也能无缝切换至备用系统,维持模型训练不中断,保护长期项目免受时间与资源损耗,确保进展与收益。
- 大模型应用开发,帮助开发者快速构建应用
在企业中,项目级复杂任务通常需要理解任务并拆解成多个问题再进行决策,然后调用多个子系统去执行。MaaS基于多个优质昇腾云开源大模型,提供MCP服务,让大模型准确理解业务意图,分解复杂任务,沉淀出丰富的解决方案,帮助企业快速智能构建和部署大模型应用。
支持区域
仅“华东二”、“西南-贵阳一”和“华北-乌兰察布一”区域支持使用MaaS。
使用流程
下表展示了MaaS的核心使用流程。
模块 |
操作 |
说明 |
相关文档 |
---|---|---|---|
授权 |
配置访问授权 |
对于所有用户(包括个人用户),需要完成ModelArts委托授权才能使用MaaS服务,否则会造成您的操作出现不可预期的错误。 |
|
在线推理服务 |
查看模型广场的预置模型 |
ModelArts Studio大模型即服务平台提供了丰富的开源大模型,在“模型广场”页面可以查看。模型详情页可以查看模型的详细介绍,根据这些信息选择合适的模型进行训练、推理,接入到企业解决方案中。 |
|
体验免费服务 |
ModelArts Studio大模型即服务平台给用户提供了免费服务,无需部署即可一键体验预置模型服务。 |
||
开通预置服务的商用服务 |
MaaS预置服务的商用服务为企业用户提供高性能、高可用的推理API服务,支持按Token用量计费的模式。该服务适用于需要商用级稳定性、更高调用频次和专业支持的场景 |
||
在预置服务中创建自定义接入点 |
自定义接入点是用户自主创建的模型服务调用入口。MaaS支持用户在预置服务中创建自定义接入点,对模型进行限流设置,通过model参数进行调用,实现不同业务场景或模型版本的分流与精细化管理。 |
||
部署模型服务 |
ModelArts Studio大模型即服务平台支持将模型广场的预置模型或者自定义模型部署到计算资源上,便于在“模型体验”或其他业务环境中可以调用该模型。 |
||
在线体验 |
模型在线体验 |
您可以在“模型体验”页面,使用预置服务的商用服务、预置服务的免费服务或者自部署的模型服务进行功能体验。 |
|
API调用 |
调用模型服务 |
您可以对预置服务的商用服务、预置服务的免费服务或者自部署的模型服务进行API调用。 |
|
模型管理 |
创建模型 |
ModelArts Studio提供了基于昇腾云算力适配的开源大模型,您可以使用这些基础模型,结合自定义的模型权重文件,创建个人专属的模型。创建成功的模型可以进行调优、压缩、推理等操作。 |
|
模型压缩 |
在ModelArts Studio大模型即服务平台支持对模型广场的预置模型或者自定义模型进行压缩,以此提升推理服务性能、降低部署成本。 |
||
模型训练 |
模型调优 |
完成数据集的准备后,可以在ModelArts Studio大模型即服务平台对模型广场的预置模型或者自定义模型进行调优。模型调优,即使用训练数据集和验证数据集训练模型。 |
|
应用中心 |
管理应用 |
MaaS应用广场提供了多种AI原型应用,帮助您“一键复制”完成基础应用搭建。 |
|
管理MCP服务 |
MaaS支持本地部署和云端部署MCP服务。
|
||
应用体验 |
ModelArts Studio大模型即服务平台提供了MaaS应用体验中心,为具体的应用场景提供一整套解决方案。 |
||
管理与统计 |
查看服务的调用数据和监控指标 |
MaaS提供调用统计功能,支持查看我的服务、预置服务的商用服务、预置服务的免费服务在指定时间段内的调用数据和监控指标详情,包括总调用次数、总调用失败次数、调用总Tokens数、输入Tokens数、输出Tokens数、平均响应时延等信息,并以分钟为最小时间粒度展示数据趋势,帮助您了解服务的使用情况和性能变化,从而更有效地进行模型评估、问题定位、故障排除和性能优化。 |