更新时间:2021-09-18 GMT+08:00
学件简介
NAIE模型训练服务预置了KPI异常检测、多层嵌套异常检测、硬盘故障根因分析等多个学件,供用户直接利用学件能力,定制生成业务模型。
背景
网络AI特性开发业务活动中,对很多运维场景有共性需求,比如异常检测、故障定位、故障预防预测等。以KPI异常检测场景为例,存在如下共性需求:
- 运营商和企业客户对于KPI实时查看,快速定位故障有共性需求。
- 运营商网络中存在海量KPI。例如:路由器有70000+KPI,其中丢包和统计类有4000+KPI。
- DCN对接口/设备KPI、光链路、VM/应用均有异常检测需求。
针对KPI异常检测场景,缺乏公共算法能力积累,异常检测模型开发效率低,成本高。存在如下问题:
- 产品对异常检测需求持续增加,单个异常检测模型开发周期约6个月,无法快速生成模型。
- 同时需要投入1至2名算法专家进行数据清洗、特征分析、模型选择和验证等工作,模型开发成本高。
学件概念
学件可以重用已有学件进行开发,不必从头开发。
学件(Learnware)= 模型(model)+ 规约(specification)
其中,规约需要能够描述模型,模型需要满足如下条件:
- 可重用:不同用户之间可分享模型,不需要分享数据,避免了数据隐私和数据保护。
- 可演进:学件本身需要可演进,能适应环境,可增量学习
- 可了解:规约需要给出模型应用场景。
学件还具备如下特点和优势:
- 可不依赖数据:通过数据训练好的模型提供出去。把参数、网络结构等内容提供给出去,不提供数据,解决数据安全问题。
- 可不依赖专家:具备基础模型,在约定的模型应用场景中可部分重用。
父主题: 学件开发指南