更新时间:2021-09-18 GMT+08:00
分享

模型生成

无线小区流量预测模型生成服务,支持“样例数据”和“数据目录”两种方式导入数据,相关操作如下所示。

样例数据方式

提供样例数据,供用户体验服务。

  1. 在服务首页,单击新增服务所在行,对应“操作”列的图标。

    进入服务配置界面,如图1所示。
    图1 服务配置界面

  2. 设置“数据集来源”,从下拉框中选择“样例数据”。

    服务已预置“数据文件模版”样例数据集,支持查看样例数据。单击“数据文件模版”,下载数据文件压缩包“template_traffic.zip”。

    压缩包中包含如下两个文件:

    • template_traffic_train.xlsx:小区历史话统数据。必须包含四个月以上的数据,默认数据采样的时间间隔为30分钟,四个月的数据完整度越好,训练出的模型精度越高。
    • template_engineering_parameters.xlsx:基站小区工参数据。

  3. 单击“数据导入”,数据检查结果如图2所示。

    这里的数据检查只会对小区话统数据做检查。从“数据详情”界面可以查看数据无效值的数量和占比,并分析无效值的可能原因。

    小区话统数据默认按照时间先后顺序,前80%为训练数据集,后20%为测试数据集。保持默认设置即可。

    图2 数据详情

  4. 单击“确定”,完成数据导入。
  5. 单击“模型生成”,返回无线小区流量预测模型生成服务首页。

    如果“服务列表”中,当前服务所在行,对应“服务状态”列展示“模型已生成”。说明模型生成完成。

数据目录方式

支持数据托管在数据服务,通过在数据集服务,订购工参类型和话统类型数据集,并导入至无线小区流量预测模型生成服务使用。

  • “工参”数据集:物理事件部署信息。
  • “话统”数据集:业务信息。
  1. 在服务首页,单击新增服务所在行,对应“操作”列的图标。

    进入服务配置界面,如图3所示。
    图3 服务配置界面

  2. 设置“数据集来源”,从下拉框中选择“数据目录”。

    通过数据目录方式导入工参和话统数据集。

  3. 单击“选择数据目录”右侧的图标,弹出“数据目录”对话框。
  4. 单击右上角的“订阅”,进入数据集服务首页。
  5. 在数据集服务首页,通过左侧目录查找需要订阅的数据集。单击“我要订阅”,填写完订阅申请信息后,单击“立即申请”,等待数据集服务管理员审批。
  6. 用户可以单击数据集服务首页右上角的“个人中心”,在“我的申请”中查看订阅数据集审批情况。审批通过后,数据集服务会向用户账户配置的邮箱发送邮件通知。
  7. 审批通过后,在数据集服务个人中心页面左侧单击“已订阅数据集”,在右侧页面单击订阅申请记录所在行对应“操作”列的“我要下载”。
  8. 在弹出的“下载”对话框,单击“请选择下载OBS路径”下方的“Root”,单击“下一步”。
  9. “下载方式”默认选择“全量下载”,单击“下一步”。
  10. 勾选承诺书前的复选框,签署承诺书,单击“下载”。
  11. 弹出提交下载操作成功提示,单击“确认”。
  12. 单击界面右上角的图标,刷新页面,当申请记录“下载结果”列变为“下载成功”时,表示数据集已成功下载至OBS桶。
  13. 已订阅的数据集下载成功后,回到无线小区流量预测模型生成服务“数据目录”对话框界面,单击左上角的“刷新”,即可展示已订阅的数据集。订阅结果如图4所示。

    图4 订阅数据

  14. 勾选工参数据集和话统数据集,并根据数据集实际类型设置“数据类别”为“工参”或“话统”。
  15. 单击“创建”,完成数据导入。
  16. 请参考表1设置“预测参数设置”区域参数。

    表1 预测参数设置

    参数

    参数说明

    预测类型

    当前服务提供的预测能力。

    包含如下选项:

    • 负载(PRB):物理资源块,标识资源使用的数量。
    • 流量:统计周期内,基站小区使用的上下行流量之和。
    • 用户数:统计周期内,平均使用业务的用户数。

    从下拉框中选择“负载(PRB)”。

    最大预测时长(小时)

    流量预测服务一次可以预测的最长时间段。以半小时为间隔进行预测,最长不能超过24小时。保持默认值:2。

    迭代次数(次)

    流量预测服务需要迭代次数,以便进行准确预测。用户可以根据实际情况设置需要迭代的次数,最大不要超过200W次。

    默认值为5000。

    训练周期(s)

    流量预测服务需要训练周期,以便进行准确预测。用户可以根据实际情况设置训练周期,当前支持的周期为:

    • 900
    • 1800
    • 3600

    默认值为1800。

    预测参考历史天数(天)

    待预测的每个时刻点需要参考的历史天数的数据。保持默认值:15。

    预测参考历史天数就是模型训练时一个历史周期对应的天数。目前,模型训练采用集成学习的方式,从历史数据中抽取15天的样本数据,作为一组,进行模型训练,得到一个低精度的模型,依次类推,经过很多次的模型训练后,将所有的低精度模型拟合成一个高精度模型。

    预测参考邻区个数

    待预测基站小区的相邻基站小区个数。保持默认值:8。用户可根据实际情况进行设置。

  17. 请参考表2设置“高级设置”区域参数。

    表2 高级设置

    参数

    参数说明

    预测参考因素

    预测参考因素有助于提升突发流量或流量预测服务本身的精度。

    当前支持如下预测参考因素:

    • 关断时长:统计周期内,当前基站小区的历史关断时长数据。
    • 地理因素(POI):统计周期内,当前基站小区的地理因素数据。
    • 天气:统计周期内,当前基站小区所在区域的历史天气数据。
    • 重大事件:统计周期内,当前基站小区的历史重大事件数据。

    模型自动更新(天)

    模型多少天自动更新一次。单位:天。

    包含如下选项:

    • 未启用
    • 15
    • 30
    • 60

    如果启用“模型自动更新”服务,平台自动获取最新的数据,更新流量预测服务,用于提升流量预测服务的预测精度。

    保持默认值:未启用。

  18. 单击“模型生成”。

    如果“服务列表”中,当前服务所在行,对应“服务状态”列展示“模型已生成”,说明模型生成完成。

分享:

    相关文档

    相关产品

close