- 文字识别-发票识别与验真
- 内容审核-图片审核
- 人证核身解决方案
- 华为云D-Plan解决方案
- 语音识别-客服中心语音质检
- 语音识别-隐私通话内容分析
- 文字识别-网络货运解决方案
- 软通动力智能流程机器人
- AR现场作业解决方案实践
- 文字识别-快递电子面单识别
- 基于开源模型构建高可用AIGC应用
- 内容审核-视频审核
- 语义分析-情感分析
- 内容审核-音频审核
- 三电数据分析及预测
- 基于TTS快速实现文字转语音
- 基于GPT-SoVITS快速实现语音克隆
- 基于OBS+SFS Turbo实现AI云存储加速
- 汽车价值评估
- 基于关键词快速生成高清短视频
- 基于Geek-AI构建AI智能助手
- 基于PyTorch NPU快速部署开源大模型
- 快速搭建Dify-LLM应用开发平台
- 天宽昇腾云行业大模型适配服务解决方案
- 德勤AI场景化咨询与实施服务解决方案
- 快速搭建DeepSeek推理系统
- 快速搭建EvalScope模型性能评测平台
- 快速部署Embedding及Reranker模型
- 文档下载
- 通用参考
链接复制成功!
方案概述
应用场景
随着全球科技竞争的加剧和国际制裁背景下,中国企业对国产自主算力的需求迅速增长。昇腾行业大模型适配服务凭借其强大的高性能计算能力和深度学习算法优化,成为推动国内信创产业发展的关键力量。而各地国产化算力中心建设完成后,客户常因技术栈差异面临软硬件兼容性和使用困难,缺乏对华为昇腾AI平台的深入了解,遇到技术问题时响应不及时,影响项目推进和创新。
客户在使用昇腾算力开发模型时面临诸多挑战:
- 技术栈差异:各地国产化算力中心建设完成后,客户常因技术栈差异面临软硬件兼容性和使用困难,导致开发效率低下。
- 技术理解不足:部分客户缺乏对华为昇腾AI平台的深入了解,遇到技术问题时响应不及时,影响项目推进和创新。
- 迁移难度大:AI模型迁移面临算子层、框架层、模型层等多技术体系,迁移过程中遇到算子不适配场景难以解决,迁移后模型需要进行准确和性能调优,依赖专家经验进行模型分析与调优。
- 开发环境复杂:AI开发面临算子层、模型层、应用使能层等多技术体系的熟悉,学习难;AI现场开发过程中常会遇到难点问题、新特性理解不深入,问题求助响应慢;模型运行依赖多,开发环境搭建复杂;工具链种类多,学习周期长。
- 专业人才短缺:客户虽然有专业的AI算法工程师团队,但不了解CANN与昇腾底层,在开发过程中遇到底层问题疑难问题难以处理。算法工程师定位底层问题效率低,不了解昇腾有哪些可以利用依赖的工具链,疑难问题求助依赖社区途径。
- 调优经验不足:昇腾迁移调优经验少,CANN层问题不会处理,不了解昇腾的调度逻辑。缺乏大模型调优经验,针对模型性能与精度优化没有有效的方法,没有类似算子优化层面的高阶调优能力。
- AI使用门槛高:AI训练/推理算力+基础大模型+适配服务+应用改造端到端成本高,特别是本地化部署推理算力场景,迫切需要高性价比方案。
通过本方案实现的业务效果:
本章节介绍如何通过天宽昇腾云行业大模型适配服务解决方案,提供模型从开发到迁移的全流程支持,优化模型性能,确保业务平稳运行。
- 全栈式技术服务:提供算法框架、计算框架、加速框架、硬件组网以及芯片型号等组合的全栈支持能力,确保模型在不同硬件平台上的高效运行。
- 高效模型迁移适配:通过自动化迁移工具和专业的技术支持,实现模型从GPU平台快速、无缝地迁移到昇腾NPU平台,确保模型在新平台上的性能和精度不受影响;
- 多维度性能调优:针对昇腾平台架构原理,供从算子、内存、通信、调度等多维度的调优手段,优化DeepSeek推理引擎,Token生成速度提升20-30%。
- 专业服务团队支撑:具备经验丰富的现场工程师和远程专家团队,帮助客户快速定位精度问题,解决性能瓶颈,业务上线时间缩短25%。
解决方案实践的应用行业推荐:
通过华为云高性价比国产算力算力,结合天宽昇腾云行业大模型适配服务,为客户提供从模型设计、数据处理到训练、优化、部署的一站式AI模型服务,确保模型准确适配行业需求,快速实现业务落地。特别适合如下行业:
- 政府与公共服务:大量昇腾算力中心建设完成后,客户常因技术栈差异面临软硬件兼容性和使用困难的问题,需要专业技术团队为客户提供昇腾设备的使用支持服务,旨在提升昇腾开发效率、降低昇腾开发门槛,处理客户在开发过程中遇到的技术问题。
- 能源与电力:新能源的快速发展给电网稳定性带来巨大挑战,在各业务场景中迫切需要引入大模型提升管理效率,而通用基础模型往往无法直接使用,天宽深耕电力行业,具备丰富的技术实力和行业经验,通过对行业知识与场景需求的深度融合,为客户提供 NLP、CV、多模态等领域的模型应用解决方案,帮助企业解决特定的业务问题。
方案架构
天宽昇腾云行业大模型适配服务通过深度学习算法优化与高效计算,结合华为昇腾算力,为各行业提供全面的大模型迁移、适配与优化服务。天宽通过深度优化昇腾算力,结合大规模分布式训练、模型微调与部署等核心能力,针对不同行业的需求,为客户提供从模型设计、训练到部署的一站式服务,助力企业快速落地AI应用。
业务架构

行业大模型适配服务:
- 模型开发咨询服务:天宽的专家服务团队熟悉大模型在各个关键行业的落地路径,积累多个行业大模型应用全栈解决方案,具备丰富的大模型需求分析经验和专业知识,包括面向NLP的对话问答、文案生成、图像分类、语义分割等任务有深入了解,为客户提供落地方案选择建议,为客户提供NLP、CV、多模态等领域L0级别大模型的服务部署方案的全面规划设计。我们将利用大模型(DeepSeek等)、计算机视觉算法(例如ResNet、YOLO等)、以及多模态融合技术(如CLIP等),为客户量身定制符合其业务需求的部署方案。调研客户业务需求场景,明确迁移前模型运行的硬件型号、精度、性能基线,使用迁移分析工具采集目标网络中的模型/算子清单,识别第三方库及目标网络中算子支持情况,分析模型迁移的可行性。
- 模型开发训练:天宽团队熟悉业界多种基础模型,24年初开始适配DeepSeek, 当前已支持 V3/R1/Distill全系列,相比之前模型训练成本降低20%,根据业务需求和数据特性,为用户定制模型开发训练方案,选择合适的预训练架构,并设定训练目标,调整数据集、调整超参等,通过多轮实验,训练出理想的模型确保模型效果。团队具备使用Python(Pandas, NumPy)进行数据清洗和预处理的专业技能。熟悉数据清洗流程,包括但不限于去除重复值、处理缺失数据、异常值检测和修正,帮助客户快速准备训练数据集。为用户模型提供高效、稳定的训练服务,确保模型快速收敛。
- 模型评估调优:针对模型编写训练脚本,在训练代码中添加评估代码,训练作业结束后查看相应的评估诊断建议。执行模型在预设测试集上的推理,收集性能数据。进行在线评测以模拟真实世界环境下的模型表现。对于未达标的指标,深入分析可能的原因,如数据质量、过拟合或欠拟合问题。使用混淆矩阵、ROC曲线等工具深入理解模型的行为和潜在不足。根据评测结果优化模型:根据评测反馈,调整模型架构、训练过程或数据处理流程。实施增量更新和微调策略,逐步提高模型性能。
- 模型应用开发:熟悉 Agent 智能体、LangChain 等大型模型框架的工作原理和设计思想,能够理解其内部的架构和组件,并且掌握在这些框架基础上进行工程化开发的方法和技巧,通过RAG优化、Prompt工程,快速地开发和部署 Agent,并且确保其在实际应用中的性能和稳定性,开发接口与业务系统集成,确保应用与业务目标完美对接。
- 推理部署:设计合适的部署架构和环境,确保模型能够在生产环境中高效运行。AI模型开发完成后,在ModelArts中将AI模型创建为AI应用,快速部署为推理服务,通过调用API的方式把AI推理能力集成到系统或平台。
- 模型运维服务:为客户提供专业的技术咨询服务,包括使用方法、性能评估、应用场景适配等。根据服务水平协议 SLA 提供响应时间和问题解决时间的承诺,以确保用户在使用大模型平台时能够得到及时有效的帮助。实施系统监控,实时跟踪大模型产品的运行状态,一旦检测到异常,帮助客户快速定位,提供故障排除和修复服务,以最小化对用户业务的影响。提供现场支持服务,以满足用户特定的现场服务需求。
昇腾模型迁移优化服务:
模型迁移优化:通过多个行业项目机会团队积累了丰富的大模型迁移适配经验。团队能够分析模型迁移的可行性,熟悉昇腾对模型的第三方库及算子的支持情况,在迁移可行性分析中如果存在平台未支持的算子,可通过修改模型脚本,使用等价支持的算子替换的方式解决,开发模型迁移脚本,实现GPU -> NPU的接口替换、NPU分布式框架改造,适配模型关键功能,包括(可选)混合精度适配、环境变量和脚本配置等。对性能出现劣化情况,可以进行针对性调优
部署架构

方案通过华为云提供的一站式AI开发平台ModelArts,对象存储服务OBS等服务,为客户提供从模型设计、训练到部署的一站式服务,助力企业快速落地AI应用。
- AI开发平台ModelArts:提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。
- 对象存储服务:存储数据和模型,实现安全、高可靠和低成本的存储需求。
- 云容器引擎:ModelArts使用云容器引擎部署模型为在线服务,支持服务的高并发和弹性伸缩需求。
- 容器镜像服务:使用ModelArts不支持的AI框架构建模型时,可通过构建的自定义镜像导入ModelArts进行训练或推理。
- 云监控服务:使用云监控服务监控在线服务和对应模型负载,执行自动实时监控、告警和通知操作。
- 云审计服务:使用云审计服务记录ModelArts相关的操作事件,便于日后的查询、审计和回溯。
方案优势
通过天宽昇腾云行业大模型适配服务,用户能够在华为云高性价比的昇腾算力支持下,克服技术栈差异、技术理解不足、迁移难度大、开发环境复杂、专业人才短缺和调优经验不足等痛点,实现高效、可靠的AI应用落地,推动企业的数字化转型。
- 高效模型迁移与适配:支持模型从GPU平台快速迁移至昇腾NPU平台,提供自动化迁移工具与算子适配,确保模型无缝迁移。
- 定制化行业模型开发:针对不同行业的特定业务场景,提供专属的模型设计与训练服务,满足复杂场景需求,实现准确适配。
- 高性能计算支持:基于昇腾云的强大算力,通过算子优化、内存管理与梯度优化等技术,显著提升模型的训练效率和推理速度。
- 精度调优与性能优化:提供专业的精度调试与性能调优服务,确保模型在迁移后能够保持与原平台一致的精度,并优化推理性能。