文档首页> 数据湖探索 DLI> 最佳实践> 数据分析> 使用DLI进行车联网场景驾驶行为数据分析
更新时间:2024-04-29 GMT+08:00

使用DLI进行车联网场景驾驶行为数据分析

应用场景

在车联网领域,云计算与大数据为企业提供了强大的分析挖掘能力,可以帮助企业和车队管理者更加科学、便捷地进行车辆数据管理与分析。

方案架构

根据已有的某货运公司车辆定时上报的详单数据和货运订单数据,DLI可以完成对该货运公司车辆行驶特点分析、记录明细的查询。

详细的数据说明请参考数据说明

图1 方案简介

流程指导

使用DLI进行驾驶行为数据分析的操作过程主要包括以下步骤:

步骤1:上传数据。将数据上传到对象存储服务OBS,为后面使用DLI完成数据分析做准备。

步骤2:分析数据。使用DLI对待分析的数据进行查询。

示例代码

具体样例数据及详细SQL语句可以通过数据包进行下载。

方案优势

  • 数据免搬迁:DLI支持与多种数据源的对接,直接通过SQL建表就可以完成数据源的映射。
  • 简单易用:直接使用标准SQL编写指标分析逻辑,无需关注背后复杂的分布式计算平台。
  • 按需计费:日志分析按时效性要求按周期进行调度,每次调度之间存在大量空闲期。DLI按需计费只在使用期间收费,有效节约队列成本。

资源和成本规划

表1 资源和成本规划

资源

资源说明

成本说明

OBS

需要创建一个OBS桶将数据上传到对象存储服务OBS,为后面使用DLI完成数据分析做准备。

OBS的使用涉及以下几项费用:

  • 存储费用:静态网站文件存储在OBS中产生的存储费用
  • 请求费用:用户访问OBS中存储的静态网站文件时产生的请求费用
  • 流量费用:用户使用自定义域名通过公网访问OBS时产生的流量费用

实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关,请根据自己的业务进行预估。

DLI

在创建SQL作业前需购买队列,使用DLI的队列资源时,按照队列CU时进行计费。

如购买按需计费的队列,在使用队列资源时,按照队列CU时进行计费。

以小时为单位进行结算。不足一小时按一小时计费,小时数按整点计算。队列CU时按需计费的计算费用=单价*CU数*小时数。

数据说明

  • 详单数据

    车辆上报的详单数据,包括定时上报的位置记录和异常的驾驶行为触发的告警事件数据。

    表2 详单数据

    字段名称

    字段类型

    字段说明

    driverID

    string

    驾驶员ID

    carNumber

    string

    车牌号

    latitude

    double

    纬度

    longitude

    double

    经度

    speed

    int

    速度

    direction

    int

    方向

    siteName

    string

    地点

    time

    timestamp

    记录上报时间

    isRapidlySpeedup

    int

    急加速标识,“1”表示急加速,“0”表示非急加速

    isRapidlySlowdown

    int

    急减速

    isNeutralSlide

    int

    空挡滑行

    isNeutralSlideFinished

    int

    空挡滑行结束

    neutralSlideTime

    bigint

    空挡滑行时长

    isOverspeed

    int

    超速

    isOverspeedFinished

    int

    超速结束

    overspeedTime

    bigint

    超速时长

    isFatigueDriving

    int

    疲劳驾驶

    isHthrottleStop

    int

    停车轰油门

    isOilLeak

    int

    用油异常

  • 订单数据

    订单数据记录了货运订单相关的信息。

    表3 订单数据

    字段名称

    字段类型

    字段说明

    orderNumber

    string

    订单号

    driverID

    string

    驾驶员ID

    carNumber

    string

    车牌号

    customerID

    string

    客户ID

    sourceCity

    string

    出发城市

    targetCity

    string

    到达城市

    expectArriveTime

    timestamp

    期望送达时间

    time

    timestamp

    记录产生时间

    action

    string

    事件类型,包括创建订单、开始发货、货物送达、订单签收等事件

步骤1:上传数据

将数据上传到对象存储服务OBS,为后面使用DLI完成数据分析做准备。
  1. 下载OBS Browser+。下载地址请参考《对象存储服务工具指南》。
  2. 安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。
  3. 登录OBS Browser+。OBS Browser+支持AK方式登录,以及授权码登录两种登录方式。登录步骤请参考《对象存储服务工具指南》。
  4. 通过OBS Browser+上传数据。

    在OBS Browser+页面单击“创建桶”,按照要求选择“区域”和填写“桶名”(例如:dli-demo),其他参数保持默认或根据需要选择,创建桶成功后,返回桶列表,单击桶dli-demo。OBS Browser+提供强大的拖拽上传功能,您可以将本地的一个或多个文件或者文件夹拖拽到对象存储的对象列表或者并行文件系统的对象列表中;同时您也可以将文件或文件夹拖拽到指定的目录上,这样可以上传到指定的目录中。

    单击Best_Practice_01.zip获取本示例的测试数据,将“Best_Practice_01.zip”压缩包解压。后续操作说明如下:

    • 详单数据:将解压后Data目录下的“detail-records”文件夹上传到OBS桶根目录下。
    • 订单数据:将解压后Data目录下的“order-records”文件夹上传到OBS桶根目录下。

步骤2:分析数据

使用DLI对分析的数据进行查询。

  1. 创建数据库、表。
    1. 在Console页面上方菜单栏中单击“产品”,单击“大数据”分类中的“数据湖探索 DLI”。
    2. 在DLI控制台总览页面左侧,单击“SQL编辑器”,进入SQL作业编辑器页面。
    3. 在SQL作业编辑器左侧,选择“数据库”页签,单击创建demo数据库,请参见图2
      图2 创建数据库

      “default”为内置数据库,不能使用该数据库名。

    4. 选择demo数据库,在编辑框中输入以下SQL语句:
      create table detail_records(
        driverID String,
        carNumber String, 
        latitude double,
        longitude double,
        speed int,
        direction int,
        siteName String,
        time timestamp,
        isRapidlySpeedup int,
        isRapidlySlowdown int,
        isNeutralSlide int,
        isNeutralSlideFinished int,
        neutralSlideTime long,
        isOverspeed int,
        isOverspeedFinished int,
        overspeedTime long,
        isFatigueDriving int,
        isHthrottleStop int,
        isOilLeak int) USING CSV OPTIONS (PATH 'obs://dli-demo/detail-records/');

      使用该案例时,需将上述SQL语句中的文件路径修改为实际存放详单数据的OBS路径。

    5. 单击“执行”,创建详单表detail_records,请参见图3
      图3 创建详单表
    6. 执行以下SQL语句,在demo数据库下创建告警事件表event_records,步骤同1.d1.e
      create table event_records(
        driverID String,
        carNumber String, 
        latitude double,
        longitude double,
        speed int,
        direction int,
        siteName String,
        time timestamp,
        isRapidlySpeedup int,
        isRapidlySlowdown int,
        isNeutralSlide int,
        isNeutralSlideFinished int,
        neutralSlideTime long,
        isOverspeed int,
        isOverspeedFinished int,
        overspeedTime long,
        isFatigueDriving int,
        isHthrottleStop int,
        isOilLeak int) 
    7. 执行以下SQL语句,将告警事件数据从详单中抽取出来插入到event_records表中。
      insert into table event_records
      (select *
      from detail_records
      where isRapidlySpeedup > 0
      OR isRapidlySlowdown > 0
      OR isNeutralSlide > 0
      OR isNeutralSlideFinished > 0
      OR isOverspeed > 0
      OR isOverspeedFinished > 0
      OR isFatigueDriving > 0
      OR isHthrottleStop > 0
      OR isOilLeak > 0)
    8. 使用另一种方式创建订单表order_records。
      在SQL作业编辑器左侧,选择“数据库”页签,单击数据库“demo”,单击表菜单右边的加号,创建表,数据位置选择DLI,请参见图4。字段类型请参见订单数据
      图4 创建订单表
    9. 将OBS数据导入到order_records表,单击“数据管理 > 库表管理”,单击demo数据库,进入“表管理”页面,单击order_records表对应“操作”列中的“更多”>“导入”,数据格式选择“CSV”,数据源路径为“obs://dli-demo/order-records/”,参数配置完成后单击“确定”。请参见图5

      导入数据时,默认时间戳格式为“yyyy-MM-dd HH:mm:ss”,如果采用其他日期格式,可打开“高级选项”手动输入(本示例该选项不做修改)。

      图5 导入表数据
  2. 执行查询
    1. 执行以下SQL语句,对所有司机在某段时间的异常告警事件进行统计。

      常用查询语句可以在SQL编辑器中,选择“更多 > 设为模板”设置为模板。设为模板后,后续可以在模板管理页面找到对应模板进行SQL查询和修改。

      具体操作为:选择“作业模板 > SQL模板 > 自定义模板”,在对应模板的操作列,单击“执行”会跳转到SQL语句编辑器,修改查询条件可以很方便地查找对应的数据。

      select
        driverID,
        carNumber,
        sum(isRapidlySpeedup) as rapidlySpeedupTimes,
        sum(isRapidlySlowdown) as rapidlySlowdownTimes,
        sum(isNeutralSlide) as neutralSlideTimes,
        sum(neutralSlideTime) as neutralSlideTimeTotal,
        sum(isOverspeed) as overspeedTimes,
        sum(overspeedTime) as overspeedTimeTotal,
        sum(isFatigueDriving) as fatigueDrivingTimes,
        sum(isHthrottleStop) as hthrottleStopTimes,
        sum(isOilLeak) as oilLeakTimes
      from
        event_records
      where
        time >= "2017-01-01 00:00:00"
        and time <= "2017-02-01 00:00:00"
      group by
        driverID,
        carNumber
      order by
        rapidlySpeedupTimes desc,
        rapidlySlowdownTimes desc,
        neutralSlideTimes desc,
        neutralSlideTimeTotal desc,
        overspeedTimes desc,
        overspeedTimeTotal desc,
        fatigueDrivingTimes desc,
        hthrottleStopTimes desc,
        oilLeakTimes desc

      在查询结果中,单击“结果图形化”:

      • “图形类型”选择“柱状图”
      • “X轴”选择“driverID”
      • “Y轴”选择“rapidlySpeedupTimes”
      • “结果数目”选择“10”

      展示结果如下:

      图6 急加速
    2. 执行以下SQL语句,查询某个司机在某个时间段的详细记录。
      select
        *
      from
        event_records
      where
        driverID = "panxian1000005"
        and time >= "2017-01-01 00:00:00"
        and time <= "2017-02-01 00:00:00"

      在查询结果中,单击“结果图形化”:

      • “图形类型”选择“柱状图”
      • “X轴”选择“driverID”
      • “Y轴”选择“speed”
      • “结果数目”选择“10”

      展示结果如下:

      图7 超速记录
    3. 执行以下SQL语句,查询订单信息。
      select
        *
      from
        order_records
      where
        orderNumber = "2017013013584419488"
      order by
        time desc
      图8 订单信息
    4. 执行以下SQL语句,根据司机和发车时间信息查询司机的详细行驶特点。
      select
        driverID,
        carNumber,
        latitude,
        longitude,
        siteName,
        time
      from
        detail_records
      where
        driverID = "panxian1000005"
        and time > "2017-01-30 16:00:00"
        and siteName IS NOT NULL
      order by
        time desc

      在查询结果中,单击“结果图形化”:

      • “图形类型”选择“柱状图”
      • “X轴”选择“time”
      • “Y轴”选择“latitude”
      • “结果数目”选择“10”

      展示结果如下:

      图9 行驶信息