使用DLI进行车联网场景驾驶行为数据分析
应用场景
在车联网领域,云计算与大数据为企业提供了强大的分析挖掘能力,可以帮助企业和车队管理者更加科学、便捷地进行车辆数据管理与分析。
流程指导
使用DLI进行驾驶行为数据分析的操作过程主要包括以下步骤:
步骤1:上传数据。将数据上传到对象存储服务OBS,为后面使用DLI完成数据分析做准备。
步骤2:分析数据。使用DLI对待分析的数据进行查询。
示例代码
具体样例数据及详细SQL语句可以通过数据包进行下载。
方案优势
- 数据免搬迁:DLI支持与多种数据源的对接,直接通过SQL建表就可以完成数据源的映射。
- 简单易用:直接使用标准SQL编写指标分析逻辑,无需关注背后复杂的分布式计算平台。
- 按需计费:日志分析按时效性要求按周期进行调度,每次调度之间存在大量空闲期。DLI按需计费只在使用期间收费,有效节约队列成本。
资源和成本规划
资源 |
资源说明 |
成本说明 |
---|---|---|
OBS |
需要创建一个OBS桶将数据上传到对象存储服务OBS,为后面使用DLI完成数据分析做准备。 |
OBS的使用涉及以下几项费用: 实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关,请根据自己的业务进行预估。 |
DLI |
在创建SQL作业前需购买队列,使用DLI的队列资源时,按照队列CU时进行计费。 |
如购买按需计费的队列,在使用队列资源时,按照队列CU时进行计费。 以小时为单位进行结算。不足一小时按一小时计费,小时数按整点计算。队列CU时按需计费的计算费用=单价*CU数*小时数。 |
数据说明
- 详单数据
车辆上报的详单数据,包括定时上报的位置记录和异常的驾驶行为触发的告警事件数据。
表2 详单数据 字段名称
字段类型
字段说明
driverID
string
驾驶员ID
carNumber
string
车牌号
latitude
double
纬度
longitude
double
经度
speed
int
速度
direction
int
方向
siteName
string
地点
time
timestamp
记录上报时间
isRapidlySpeedup
int
急加速标识,“1”表示急加速,“0”表示非急加速
isRapidlySlowdown
int
急减速
isNeutralSlide
int
空挡滑行
isNeutralSlideFinished
int
空挡滑行结束
neutralSlideTime
bigint
空挡滑行时长
isOverspeed
int
超速
isOverspeedFinished
int
超速结束
overspeedTime
bigint
超速时长
isFatigueDriving
int
疲劳驾驶
isHthrottleStop
int
停车轰油门
isOilLeak
int
用油异常
- 订单数据
表3 订单数据 字段名称
字段类型
字段说明
orderNumber
string
订单号
driverID
string
驾驶员ID
carNumber
string
车牌号
customerID
string
客户ID
sourceCity
string
出发城市
targetCity
string
到达城市
expectArriveTime
timestamp
期望送达时间
time
timestamp
记录产生时间
action
string
事件类型,包括创建订单、开始发货、货物送达、订单签收等事件
步骤1:上传数据
- 下载OBS Browser+。下载地址请参考《对象存储服务工具指南》。
- 安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。
- 登录OBS Browser+。OBS Browser+支持AK方式登录,以及授权码登录两种登录方式。登录步骤请参考《对象存储服务工具指南》。
- 通过OBS Browser+上传数据。
在OBS Browser+页面单击“创建桶”,按照要求选择“区域”和填写“桶名”(例如:dli-demo),其他参数保持默认或根据需要选择,创建桶成功后,返回桶列表,单击桶dli-demo。OBS Browser+提供强大的拖拽上传功能,您可以将本地的一个或多个文件或者文件夹拖拽到对象存储的对象列表或者并行文件系统的对象列表中;同时您也可以将文件或文件夹拖拽到指定的目录上,这样可以上传到指定的目录中。
单击Best_Practice_01.zip获取本示例的测试数据,将“Best_Practice_01.zip”压缩包解压。后续操作说明如下:
- 详单数据:将解压后Data目录下的“detail-records”文件夹上传到OBS桶根目录下。
- 订单数据:将解压后Data目录下的“order-records”文件夹上传到OBS桶根目录下。
步骤2:分析数据
使用DLI对分析的数据进行查询。
- 创建数据库、表。
- 在Console页面上方菜单栏中单击“产品”,单击“大数据”分类中的“数据湖探索 DLI”。
- 在DLI控制台总览页面左侧,单击“SQL编辑器”,进入SQL作业编辑器页面。
- 在SQL作业编辑器左侧,选择“数据库”页签,单击创建demo数据库,请参见图2。
“default”为内置数据库,不能使用该数据库名。
- 选择demo数据库,在编辑框中输入以下SQL语句:
create table detail_records( driverID String, carNumber String, latitude double, longitude double, speed int, direction int, siteName String, time timestamp, isRapidlySpeedup int, isRapidlySlowdown int, isNeutralSlide int, isNeutralSlideFinished int, neutralSlideTime long, isOverspeed int, isOverspeedFinished int, overspeedTime long, isFatigueDriving int, isHthrottleStop int, isOilLeak int) USING CSV OPTIONS (PATH 'obs://dli-demo/detail-records/');
使用该案例时,需将上述SQL语句中的文件路径修改为实际存放详单数据的OBS路径。
- 单击“执行”,创建详单表detail_records,请参见图3。
- 执行以下SQL语句,在demo数据库下创建告警事件表event_records,步骤同1.d和1.e。
create table event_records( driverID String, carNumber String, latitude double, longitude double, speed int, direction int, siteName String, time timestamp, isRapidlySpeedup int, isRapidlySlowdown int, isNeutralSlide int, isNeutralSlideFinished int, neutralSlideTime long, isOverspeed int, isOverspeedFinished int, overspeedTime long, isFatigueDriving int, isHthrottleStop int, isOilLeak int)
- 执行以下SQL语句,将告警事件数据从详单中抽取出来插入到event_records表中。
insert into table event_records (select * from detail_records where isRapidlySpeedup > 0 OR isRapidlySlowdown > 0 OR isNeutralSlide > 0 OR isNeutralSlideFinished > 0 OR isOverspeed > 0 OR isOverspeedFinished > 0 OR isFatigueDriving > 0 OR isHthrottleStop > 0 OR isOilLeak > 0)
- 使用另一种方式创建订单表order_records。
- 将OBS数据导入到order_records表,单击“数据管理 > 库表管理”,单击demo数据库,进入“表管理”页面,单击order_records表对应“操作”列中的“更多”>“导入”,数据格式选择“CSV”,数据源路径为“obs://dli-demo/order-records/”,参数配置完成后单击“确定”。请参见图5。
导入数据时,默认时间戳格式为“yyyy-MM-dd HH:mm:ss”,如果采用其他日期格式,可打开“高级选项”手动输入(本示例该选项不做修改)。
- 执行查询
- 执行以下SQL语句,对所有司机在某段时间的异常告警事件进行统计。
常用查询语句可以在SQL编辑器中,选择“更多 > 设为模板”设置为模板。设为模板后,后续可以在模板管理页面找到对应模板进行SQL查询和修改。
具体操作为:选择“作业模板 > SQL模板 > 自定义模板”,在对应模板的操作列,单击“执行”会跳转到SQL语句编辑器,修改查询条件可以很方便地查找对应的数据。
select driverID, carNumber, sum(isRapidlySpeedup) as rapidlySpeedupTimes, sum(isRapidlySlowdown) as rapidlySlowdownTimes, sum(isNeutralSlide) as neutralSlideTimes, sum(neutralSlideTime) as neutralSlideTimeTotal, sum(isOverspeed) as overspeedTimes, sum(overspeedTime) as overspeedTimeTotal, sum(isFatigueDriving) as fatigueDrivingTimes, sum(isHthrottleStop) as hthrottleStopTimes, sum(isOilLeak) as oilLeakTimes from event_records where time >= "2017-01-01 00:00:00" and time <= "2017-02-01 00:00:00" group by driverID, carNumber order by rapidlySpeedupTimes desc, rapidlySlowdownTimes desc, neutralSlideTimes desc, neutralSlideTimeTotal desc, overspeedTimes desc, overspeedTimeTotal desc, fatigueDrivingTimes desc, hthrottleStopTimes desc, oilLeakTimes desc
在查询结果中,单击“结果图形化”:
- “图形类型”选择“柱状图”
- “X轴”选择“driverID”
- “Y轴”选择“rapidlySpeedupTimes”
- “结果数目”选择“10”
展示结果如下:
图6 急加速
- 执行以下SQL语句,查询某个司机在某个时间段的详细记录。
select * from event_records where driverID = "panxian1000005" and time >= "2017-01-01 00:00:00" and time <= "2017-02-01 00:00:00"
在查询结果中,单击“结果图形化”:
- “图形类型”选择“柱状图”
- “X轴”选择“driverID”
- “Y轴”选择“speed”
- “结果数目”选择“10”
展示结果如下:
图7 超速记录
- 执行以下SQL语句,查询订单信息。
select * from order_records where orderNumber = "2017013013584419488" order by time desc
图8 订单信息
- 执行以下SQL语句,根据司机和发车时间信息查询司机的详细行驶特点。
select driverID, carNumber, latitude, longitude, siteName, time from detail_records where driverID = "panxian1000005" and time > "2017-01-30 16:00:00" and siteName IS NOT NULL order by time desc
在查询结果中,单击“结果图形化”:
- “图形类型”选择“柱状图”
- “X轴”选择“time”
- “Y轴”选择“latitude”
- “结果数目”选择“10”
展示结果如下:
图9 行驶信息
- 执行以下SQL语句,对所有司机在某段时间的异常告警事件进行统计。