更新时间:2021-09-18 GMT+08:00
分享

特征画像

特征画像的作用,就是对数据进行分析,把其中一些基本特征提取出来,如:周期性、离散度、时序规律、最值、采样频率等,计算KPI曲线特点(包括周期性、趋势性、噪声、离散性、随机性等)。根据计算的曲线特点,判断KPI的大类别(毛刺型、阶梯型、周期型、离散型、稀疏型、多模态型等)。这些类别,对应到后面的特征选择、算法推荐,会有不同的策略,有效提升模型的构建效率。

  1. 单击“选择数据”左下方的“特征画像”。

    新增“特征画像”内容,如图1所示。

    图1 特征画像

  2. 单击“特征画像”代码框左侧的图标,运行代码。

    通过运行结果左侧两个图可以直观的看一下原始数据和数据的密度分布图。运行结果右侧的参数说明,如表1所示。

    表1 特征画像参数说明

    参数

    说明

    设备数

    需要检测的KPI对象的数量,如设备或端口的数目。

    样本数

    训练数据总的样本数。

    采样率

    采样频率,单位为秒。60的含义为每60秒采样一次。

    开始时间

    采样的时间跨度。

    结束时间

    周期

    是否有周期的特性,给出评估的值。

    最大值

    KPI的最大值。

    最小值

    KPI的最小值。

    空值率

    有没有缺失值。取值为“0”说明,没有缺失值。

    类型

    KPI类型的计算。

    标签信息

    统计标签的样本数量。

相关文档