更新时间:2022-03-25 GMT+08:00
分享

硬盘故障预测

  • 分类

    故障预测

  • 适用领域

    运营商网络、园区网络、DC网络

  • 使用场景

    IT应用、园区运维中,运维人员难从海量硬盘指标中发现异常,可通过硬盘故障预测,快速预测异常隐患并及时发送告警通知运维人员及时关注和处理。

  • 功能描述

    硬盘故障预测模型服务基于历史硬盘数据,利用机器学习进行管理,识别出硬盘是否异常。该服务根据用户的业务配置和数据类型自动识别硬盘特征,匹配最优智能检测算法。帮助客户减少业务异常排查时间,提升故障根因定位速度。

  • 输入数据
    1. 硬盘故障预测输入数据
      • 接入方式:kafka
      • 硬盘故障预测输入字段描述如表 硬盘故障预测输入字段表所示
        表1 硬盘故障预测输入字段表

        名称

        类型

        长度

        是否必须

        描述

        disk_sn

        String

        40

        Y

        磁盘唯一序列号信息

        device_sn

        String

        40

        N

        磁盘所在服务器的序列号

        disk_manufacturer

        String

        40

        N

        硬盘厂家信息

        disk_slot

        String

        40

        N

        磁盘的槽位

        disk_pot

        String

        32

        N

        硬盘通电小时数

        disk_phyevent_icrc_count

        integer

        20

        N

        Phy Event Log的ICRC个数

        disk_collect_time

        timestamp

        -

        Y

        采集时间(年月日时分秒),格式(yyyymmdd)至少8位,并可以正常转换时间

        示例:20191114

        disk_criticalevent_count

        integer

        -

        N

        Critical Event Log的个数

        disk_errorlog_count

        integer

        40

        N

        Error Log的个数

        disk_firmware_version

        String

        40

        N

        固件版本

        disk_model

        String

        40

        N

        硬盘型号

        disk_plist_count

        integer

        -

        N

        Pending List的个数

        disk_selftest_failure_count

        integer

        40

        N

        Self-Test Log中自检不通过的个数。当“Status”出现“failure”或“failed”字段时为自检不通过

        disk_io

        integer

        -

        N

        硬盘的读写速率

        disk_dha_link_status

        integer

        -

        N

        硬盘链路的状态

        disk_dha_logic_status

        integer

        -

        N

        硬盘状态

        disk_data_source

        String

        -

        N

        硬盘数据源

        disk_production

        String

        -

        N

        硬盘来源

        disk_media_type

        String

        -

        N

        硬盘媒体类型,支持字符串加数字的形式

        disk_capacity

        integer

        -

        N

        硬盘容量,单位:GB

        interfacetype

        String

        -

        Y

        硬盘的类型,如SATA

        smart

        List

        20

        Y

        硬盘可获得的全部smart的指标

        • id:smart属性的编号,id为1即smart1底层数据读取错误率
        • raw:smart属性的编号,id为1即smart1底层数据读取错误率
        • normalized:硬盘smart指标的当前值为73
        • worst:硬盘smart指标的历史最差值为100。
        • threshold:硬盘smart指标的门限值为16
  • 输出数据
    1. 硬盘故障预测推理结果
    • 接入方式:kafka
    • 硬盘故障预测推理结果字段描述如表 硬盘故障预测推理结果所示
      表2 硬盘故障预测推理结果字段表

      名称

      类型

      长度

      是否必须

      描述

      failure

      String

      255

      Y

      坏盘标识

      probability

      String

      255

      Y

      置信率

      threshold

      String

      255

      Y

      阈值

      reason

      text

      -

      Y

      结果信息

      disk_sn

      String

      255

      Y

      硬盘编号

  • 流程详情

    数据对接 -> 硬盘故障检测 -> 记录集

    数据对接:将采集的数据按特定格式提取并传给下一个节点

    硬盘故障预测:硬盘故障预测服务对输入数据进行推理过程

    记录集:硬盘预测结果输出集

  • 使用约束

    暂无

分享:

    相关文档

    相关产品

close