GeminiDB 时序车联网解决方案
应用场景
随着新能源汽车的智能化普及,车辆的实时运行过程中产生的时间序列数据(简称:时序数据)呈现极速增长,车企、车主对车辆实时状态查询的诉求越发强烈,基于传统HBase的车辆监控平台已无法满足车企、车主对车辆实时状态查询的场景诉求。
方案总览
GeminiDB 时序车联网解决方案,针对车联网行业特有的时序数据特征,通过时序数据专属的Influx接口,实现百万级车辆海量时序数据的实时解析写入、数据自动排序/合并、实时分析,解决车企、车主对智能汽车的实时查询诉求,同时,支持高压缩率、冷热分离,有效控制成本。
方案优势
- 海量数据实时解析写入,应用开发极简
传统HBase:将车辆上报的数千监控指标作为一个字符串写入HBase,应用程序读取某个指标时,需要先读整个字符串,再解析,过程复杂,效率低。
GeminiDB Influx:将车辆上报的数千监控指标直接作为数千列写入GeminiDB,应用直接查询对应指标,无需二次解析,做到真正的实时写入、实时查询。
- 数据自动排序、合并,简化中间处理环节
车辆上报的同一时刻多维度指标数据,由于车端不同部件处理以及网络传输时延差异,无法保证数据一次性、有序上报写入。
传统HBase:应用程序需要借助Spark对HBase的数据进行合并、排序,处理复杂,无法满足实时查询诉求。
GeminiDB Influx:在时序数据写入时,对数据进行自动合并、排序,应用直接访问GeminiDB Influx查询即可返回需要的结果。
- 实时分析
传统HBase:一般将历史数据转存到Hudi,应用程序根据指标通过ElasticSearch先找到车辆VIN,再通过VIN去Hudi查对应的指标数据进行分析,涉及多系统,交互复杂,无法支撑海量数据的实时分析。
GeminiDB Influx:支持应用程序直接基于指标的一次性查询分析,一库替代多库,有效支撑业务的实时查询分析诉求。
- 高压缩率
传统HBase:只能按列族设置压缩算法,且仅支持Gzip,SNAPPY,LZO,LZ4四种压缩算法。
GeminiDB Influx:针对每列的数据类型选用不同的压缩算法,支持Simple8b,Delta,Delta-Of-Delta,RLE,Zigzag, Zstd, Snappy,Bit-packing等多种压缩算法,压缩率是传统HBase的10倍。
- 冷热分离
针对车辆的海量数据带来的存储高成本,支持用户基于业务场景配置数据的冷热策略,实现数据自动转冷,应用程序“0”改动,有效控制整体成本。