方案概述
应用场景
- 场景1:数据标签库应用场景
通过标签管理分析与预测,企业提升服务质量、效率、回馈。
客户的痛点:- 潜在投诉风险预警:热线渠道是电网企业的主要服务渠道,随着业务的不断发展,人工话务强度逐步增高,但精准服务能力低。如何在有限人力资源条件下,准确识别客户诉求、提高人工精准服务和精细化服务水平、降低人工话务工作压力、成为客户服务方面亟需解决的问题。
- 电费回收风险: 近年来社会经济发展趋缓,电力公司电费回收压力日益增大,电费回收风险防控难度不断增加,同时,由于缺乏对优劣客户的科学评价方法,电力公司无法为客户提供差别化服务,不利于供电企业权益的维护。
- 如何识别替代潜力客户:我国环保形势严峻,党和政府高度重视节能减排工作和大气污染治理,大力推进能源消费革命和供给侧结构性改革,在终端能源消费环节使用电能替代散烧煤、燃油的能源消费方式,有利于提高环保水平
- 缺乏精细化策略与运维: 目前设备状态精细化管控工作,仍没有相关的信息系统支撑,开展电网设备状态评价和运维工作时,主要基于各系统直接量测和录入的数据作为状态评价和运维决策条件,缺少基于设备综合信息的支撑方法
通过本方案实现的业务效果:- 客户对于停电通知服务满意度提高,停电报修、咨询话务量大幅下降,停电投诉量大幅减少。
采用数据建模方式综合识别停电敏感客户,实现对停电敏感度的量化分析,减少了人工主观因素,提升对停电敏感客户的识别精度;
基于投诉敏感标签,实现对敏感客户的精准服务,提升了客户服务质量,减少人员维系成本。
- 企业平均回款时长和逾期缴费率显著下降。
促使电费风险管控工作从定性主观判断转向定量精准分析,从事后处理走向提前防控,提高了风险防控工作的效率和效益;
根据客户的不同特征制定差异化防控策略,促使策略与客户特征更加匹配,策略的执行更加有效,节省了催费的人力物力消耗,降低了企业经营成本。
- 提高潜力客户的识别准确率,相比于人工普查准效率提高近 20 倍。
将全面普查转变为针对性排查,从而将有限的企业资源用到高潜力客户上,大幅提工作效率,高效拓展终端市场;
依据电能替代潜力标签,结合用户信用、资金实力等标签,针对性地解决用户电能改造中面临的资金投入、生产回报等问题,推动企业落实电能改造工作。
- 支撑企业对设备特征进行标签化提炼,构建了多维度、多层次、多视角的设备标签体系,帮助企业全面深入了解设备特征,使得企业对设备的认知更系统化、明朗化,提高管理效率,降低管理成本。同时将标签融合到采集运维工作的各处理环节中,实现支撑差异化运维策略,使得设备生产运维业务经验得到沉淀、固化、共享。
- 场景2:数据共享交换管理应用场景
客户的痛点:
- 管理不规范:数据模型管理缺乏规范化体系,大数据平台内数据的技术、业务属性不清晰,没有完善的数据模型管理体系与规范。
- 使用不明确:由于数据业务特性与使用方法不统一,难以对结构化数据、半结构化、非结构化数据的快速集成和共享。
- 监控不到位:在实际数据运行中,会出现数据信息发生中断异常或数据量发生突然变化等数据异常监控。无法通过传统的监控手段及时发现。
通过本方案实现的业务效果:
实现数据流整体监控以及数据的资产化,资产的服务化,以及数据服务的共享和监控
- 自助数据:可自助组织数据。数据散落到大数据平台各数据表中,通过数据共享发布平台可收集不同表中不同信息字段的数据,提供数据服务化能力;
- 数据服务化:实现数据目录中数据的服务化,能将数据目录中的数据以文件服务、Web接口服务、数据库服务、流数据服务等方式对外提供;
- 数据协同:跨部门的数据共享协作,通过技术元数据与业务元数据的对接避免数据不一致和数据开发返工;
- 数据工作台:工作簿根据收集的数据自动推荐关联数据,协助用户找到适用的数据,提供数据关联分析,如基于地址推荐各数据分类中包含地址数据的所有数据。
方案架构
- 数据标签库管理方案架构
- 功能架构
图1 功能架构
主体配置:支持多个标签主体的创建与维护,可满足对客户、设备、数据、员工、商品等不同主体对象的标签建设需求。
标签体系管理:提供多层级的标签分类管理功能,支撑对标签的体系化管理,满足各种标签体系建设需求。
标签创建:提供多种标签生成方式,比如规则标签、手工标签、组合标签等,以满足不同特性的标签创建需求。
标签管理:支持标签创建、审核、发布、评估、停用、优化下线的生命周期管理流程,实现标签的全生命周期管理,保证标签的运行状态清晰、有序、可控。
标签调度:支持自定义标签调度更新时间,实现静态标签与动态标签的创建,满足不同的时效性的数据标签更新需求。
画像展现:支持通过精准搜索与模糊搜索进行目标对象画像查询,并支持通过以词云或列式的方式展现标签,直观地将业务对象特征信息进行展现。
群体圈选:支持基于标签和宽表字段进行业务对象筛选功能,灵活快速定位目标群体。
标签服务:支持将标签成果以服务的形式对外发布,并支持对标签服务调用情况进行监测
- 数据逻辑架构
产品分为配置库与运算库,配置库主要存储系统配置数据需要支持事务性的关系型数据库,运算库按照标签数据量进行选型,默认设置下配置库与运算库会存放于一起
图2 数据逻辑架构
- 逻辑部署架构
标签画像负载均衡采用华为云平台负载均衡服务,标签画像分接口服务与应用服务进行部署,数据库、缓存等服务直接采用华为云数据服务
图3 逻辑部署架构
- 物理部署架构
产品支持线性扩展部署,通过灵活地扩展服务器数量提升系统处理能力,满足不同的标签处理与应用需求
单机方式部署请情况下,标签接口服务、标签画像应用服务共同部署在一台服务器中即可,且不需要Redis缓存服务。
集群情况下,通常由2台服务器部署接口服务组成标签接口服务集群,由2台服务器部署标签画像应用服务组成应用集群,且必须使用Redis缓存服务共享会话及应用热数据
图4 物理部署架构
- 部署架构与资源建议
产品支持线性扩展部署,通过灵活地扩展服务器数量提升系统处理能力,满足不同的标签处理与应用需求
图5 部署架构与资源建议
- 功能架构
- 数据共享交换管理方案架构
- 应用架构
数据服务共享平台包括资源目录管理、数据使用、数据服务开发、服务控制、调度管理、运行监控、运行维护和数据分析与信息展现,应用架构如下图所示:
图6 应用架构
资源目录管理:是可交换数据元数据的结构化展现,需支持数据库、大数据、文件、Web 服务等多类型数据资源技术元数据的采集和业务元数据的维护能力;支持面向消费者业务视图(比如按主题的划分) 的创建;提供资源注册、维护和搜索等基本功能;
数据使用:主要面向消费方,是消费者如何通过平台申请数据资源及数据管理方审批处理的过程;消费方可通过注册功能自行在平台注册,支持消费方浏览数据资源后提交资源申请(拉)和订阅(推)的方式;消费方可查看所有申请的状态及历史记录,可查看申请的汇总情况;支持单个或批量申请;
数据服务开发:主要面向开发人员,提供在线和离线两种开发方式。对于如全量开发同步、数据库到文件同步等的作业,开发人员可在 Web 页面中进行简单配置完成在线作业开发;对于复杂模型,可通过离线方式开发。数据服务开发提供作业目录管理、作业流的可视化配置等;
服务控制:平台提供用户对数据服务过程中的权限控制,包含 IP 白名单、服务状态、调用关系管理等;
调度管理:作业运行的指挥中心,可通过调度管理配置任务的调度策略,配置任务运行的优先级及触发方式等;
运行监控:对整个平台运行过程中的状态进行监控,包括物理资源、服务引擎、传输监控、故障告警、消费方等,同时提供对日志和历史记录的查看功能。
运维维护:为方便平台使用的功能,支持资源目录、作业模板、服务接口的导入导出;
数据分析与展现:针对平台作业、数据交换总量、文件传输、消费方等进行统计分析。
- 数据架构
数据架构反映平台中,各种类型数据的分布及流转情况。在数据服务共享平台中,数据可分为业务数据、元数据(含资源目录)、质量数据、作业模板及运行监控数据、统计分析数据等。
业务数据:指承载业务含义(大多来源于企业内部各业务系统及少量外部数据),由各总部及各分子公司业务部门(数据提供方)提供,转移至前置区(数据准备)后,经过相应的处理和扩展,提供给消费方。具备数据提供、数据获取、数据准备、数据处理及服务化开发、数据共享发布和数据消费的完善数据交换过程。业务数据一般存储于 ODS 区,也可直接提供点对点的方式,业务数据在平台中不存储;
元数据(资源目录):业务数据交换的整个过程,都是以元数据(资源目录)为驱动。元数据可分为技术元数据和业务元数据两种,在数据交换过程中,通过手动和自动的方式进行管理;元数据存储于平台数据库中;
质量数据:针对业务数据所开展质量评估后产生的数据,一般包括质量检核规则和检查结果数据;质量数据存储于平台数据库中,也可将结果数据生成文档后发送给业务系统主责部门;
模型及运行监控数据:平台运行过程中,各类作业的模型(模板)及配置信息,作业运行过程中的告警、监控信息和日志信息等,作业运行过程中的调度策略及调度信息;模型及运行监控数据存储于平台数据库中;
统计分析数据:针对作业、数据交换量、消费方等进行的统计分析;部分数据直接取自模型及运行监控数据,部分数据直接存储于平台数据库。
- 部署架构
数据服务共享平台部署机构如下所示:
图7 部署架构
数据服务共享平台适应于单级或多级的部署方式:
单级部署:当企业没有上级单位、平级单位、下级单位数据共享需求时可以采用单级部署方式,单级部署时依据生产环境实际情况,部署 DSP产品所有组件于物理服务器(建议服务器数量最少为二台及以上)中,其中 SSM 与 DataRelease 组件必须关联部署在同一台服务器中,当数据交换的作业量较大时,可以对 Server 组件进行集群部署,当数据服务(RESTful)的访问量大时,可以对 SSM 与 DataRelease 组件进行集群部署。
多级部署:当企业对上级单位、平级单位、下级单位有数据共享需求时可以采用多级部署方式,多级部署时将 Agent 和 GatherClient 部署于有数据共享需求的上级单位、平级单位、下级单位的物理服务器中,其他产品组件部署于企业内部服务器中,其中 SSM 与 DataRelease 组件必须关联部署在同一台服务器中,当数据交换的作业量较大时,可以对 Server组件进行集群部署,当数据服务(RESTful)的访问量大时,可以对 SSM与 DataRelease 组件进行集群部署。
- 技术架构
技术视图
数据服务共享平台整体技术框架及各过程所采用技术如下图所示:
图8 技术架构
数据服务共享平台通过多种数据(结构化数据、非结构化数据、文件数据)、协议(Http、JDBC、Socket)接入方式将已有的业务数据接入 DSP 平台,在平台中通过数据转换、加工计算等逻辑操作,发布为数据服务,通过数据共享区对外提供多种类型的数据服务。
图9 技术实现
资源层:支持对主流关系型数据库(Oracle、MySQL、SQLServer、PostgreSQL、MongoDB、Gauss100、DM),大数据(HBase、Hive)、文件等多种类型数据资源技术元数据的采集和业务元数据的维护。
平台访问层:基于 JDBC、HTTP、RPC 等通信协议实现与底层数据和文件间的访问交互,基于 Socket 通信实现平台各组件间的数据通信,确保平台中数据间交互与通讯高效、安全、可靠。
平台逻辑层:平台逻辑层依托于各类适配器、组件、引擎保证平台的安全稳定运行,适配器有数据库(DBAdapter)、HBase(HBaseAdapter)、Hive(HiveAdapter)、文件(FileAdapter)等类型;组件包含安全、监控、Redis 缓存、日志等组件;引擎包含实时服务引擎、批量服务引擎、监控引擎、日志引擎等。
服务提供层:服务提供层采用轻量级的 Web Service 架构(RESTful),其实现和操作比 SOAP 和 XML-RPC 更为简洁,可以完全通过 HTTP 协议实现对外部应用提供统一的 RESTful Web 服务。
平台展示层:平台展示层使用 VUE+ElementUI 框架,结合 CSS、AJAX 等业界前沿技术实现丰富的界面展示效果,提升使用者的交互体验。
- 应用架构
方案优势
- 数据标签库管理方案优势
- 潜在投诉风险预警,提升客户服务质量
通过分析 95598 呼叫行为数据、客户档案数据、实时数据等信息,建立潜在投诉倾向模型,输出“潜在投诉高风险”、“同一事件频繁投诉”、“倾向复电不准时投诉”等标签,依据客户标签推荐差异化服务策略,提升客户服务品质。
图10 潜在投诉风险预警
- 精准预测电费回收风险,缩短电费回收周期
通过分析客户信用、用电趋势、行业前景信息和突发事件,构建电费回收风险模型,并将分析成果通过标签的形式固化至普元标签产品,并依据用户风险级别标签等特征采取精准化风险防控策略,从而达到缩短电费回收周期的目的。
图11 精准预测电费回收风险
- 潜在投诉风险预警,提升客户服务质量
- 数据共享交换管理方案优势
DSP作为一个统一的数据服务共享平台,主要提供了对内部应用系统和外部应用系统的数据支持,具体方案如下:
图14 数据共享交换管理方案
平台包含数据资源管理、数据资源监控、自助服务构建、数据服务共享、服务监控等几部分内容:
数据资源管理:提供对已有的社会资源、管控资源、技术资源等数据资源,实现自动化的元数据采集,摸清大数据资源状况,进行行抽取转换,形成标准化的数据资源,对标准化的数据资源进行分类、加工整合,形成标准的可管理的专题、要素、标签等类型数据资源,为数据服务共享打下数据基础。
数据资源监控:对平台中数据资源流向、数据抽取转换过程及结果、数据加工过程及结果实现闭环监控,面向客户做到问题数据资源的及时发现与处理,保障平台数据的安全可靠。
自助服务构建:区别于传统的数据资源提供方式,支持自主的数据准备,快速整合多元数据,形成服务数据,对外提供web、文件、数据库、流数据四种服务开发能力,并构建服务目录,满足业务及应用需求。
数据服务共享:全局角度为跨地域数据和服务调用提供支持,为所有的异构资源提供统一的访问通道,实现系统资源管理、数据传输交换和数据共享服务管理。
服务监控:对服务调用,服务异常,数据传输,节点异常,服务耗时,服务热度等,进行服务全生命周期监控。
约束与限制
- 数据标签库管理约束与限制
- 支持的运行环境操作系统
Windows server 2008/Windows server 2008 R2/Windows server 2012/Windows server 2012R2/Windows server 2016;
Red Hat Enterprise Linux 6 或以上;
CentOS 6 或以上;
Ubuntu 14 或以上。
- 支持的数据库
GBase 8a 或以上;
Mysql 5.6 或以上;
Hadoop 大数据平台-CDH 5.7 或以上;
华为 Gauss DB 100/200;
星环大数据平台-TDH 5.1 或以上;
Pivotal Greenplum 5 或以上;
SAP HANA 2.0 或以上;
PostgreSQL 9 或以上。
- 支持的运行环境操作系统
- 数据共享交换管理约束与限制
- 支持的操作系统
银河麒麟服务器操作系统V4、银河麒麟高级服务器操作系统V10
中标麒麟高级服务器操作系统软件V7.0
UOSV20
Windows 7/10
WindowsServer2008
CentOS 7.2
开发环境:
Windows 7/10
WindowsServer2008
- 支持的数据库
Oracle 11g /Oracle12.1.0.2.0/Oracle12.2.0.1
SQL Server 2016
PostgreSql 9.6
DMV7/V8
- 支持的操作系统