配置业务关键黄金指标并查看监控报表
通过创建日志项目、日志空间、日志采集配置、创建日志配置组、安装集群插件、启动导流任务、查看采集日志、创建逻辑主体、新建指标、新建查询视图等操作快速配置业务关键黄金指标并创建生成对应的监控报表,以确保能够准确、及时地收集和分析业务关键数据,支持业务决策和优化。
步骤一:创建日志项目
- 单击
,选择“运维 > 监控服务(ServiceInsight)”。
- 选择左侧导航栏的“日志 > 日志接入”。
- 在“日志接入”页面,选择左侧导航栏的“日志项目”。
- 单击“创建日志项目”。
- 配置日志项目参数,配置完成后,单击“创建”。
表1 日志项目参数说明 参数名称
示例
参数说明
日志项目
AppStagePOCtest
自定义日志项目名称。
日志项目是一个包含多个日志服务配置的整体,可以看作是一个微服务实例。
- 同一个微服务实例下的日志服务配置应当包含在一个日志项目中。
- 不同微服务实例使用完全相同的日志服务配置时,也可以共用同一个日志项目。
描述
POC测试
输入日志项目描述,非必填项。
步骤二:创建日志空间
- 在“日志接入”页面,选择左侧导航栏的“日志空间”。
- 单击“申请实时日志空间”。
- 根据界面提示填写日志空间参数。
- 配置实时日志空间信息,参数说明如表2所示,配置完成后,单击“下一步”。
图1 配置实时日志空间信息
- 参考如下配置实时日志字段信息,然后单击“下一步”。
- 清洗规则:算子清洗
- 日志样例:
2024-02-05 14:31:19.403|INFO|(LogRecordPostFilter.java:48)|DemoServiceA|GET|http://org-app.huawei.com:8081/user/1|373|302
- 解析脚本:
- dissect: tokenizer: "%{time_local}|%{log_type}|%{message_all}|%{request_service}|%{request_type}|%{request_url}|%{delay|integer}|%{request_status|integer}" field: "message" target_prefix: "" - timestamp: field: time_local target_field: timestamp timezone: "Asia/Shanghai" target_layout: "UNIX_MS" layouts: '2006-01-02 15:04:05.999'
- 单击“测试解析脚本”,系统提示“测试解析算子成功”后单击“下一步”。确认日志字段配置是否达到预期,达到预期后可单击“下一步”。
- 在“日志空间共享”页面,单击“保存”即可。
- 系统申请成功后,状态由“申请中”变更为“已创建”。
- 配置实时日志空间信息,参数说明如表2所示,配置完成后,单击“下一步”。
步骤三:创建日志采集配置
- 在“日志接入”页面,选择左侧导航栏的“日志采集配置”。
- 单击“创建日志采集配置”,配置日志采集参数,配置完成后,单击“确定”。
图2 创建日志采集配置
表3 日志采集配置参数说明 参数名称
示例
参数说明
日志项目
AppStagePOCtest
选择已创建的日志项目,相同服务的不同日志使用同一个日志项目。
日志空间
appstage-poc-logspace
选择已创建的日志空间。选择日志空间时日志提取规则会展示日志空间定义的日志格式,采集的日志须满足对应格式。
配置名称
appstage_poc_logconfig_01
自定义日志采集配置名称。
配置类型
FILEBEAT
选择日志采集配置类型,建议选择“FILEBEAT”。
日志路径
/mnt/daemonset/aiops/WiseEyePOCMicroServiceA01User/*.log
填写实际日志路径,可使用通配符进行匹配。
- 接入容器日志需要根据通配符匹配完成。
- 注意避免同一台主机上下发的多个采集任务重复采集相同的日志文件,否则会导致filebeat进程异常。
日志TPS
100
TPS表示单实例每秒日志条数,请准确填写,用于推荐资源自动计算。
- 如果采集路径是单个日志,则按照单个日志单台机器(pod)的TPS值填写,且按照高峰期计算。
- 如果采集路径配置了通配符,则将采集的日志TPS累加,累加计算高峰期单台机器(pod)的TPS,建议按近期业务增长预期填写。
日志模式
单行模式
选择日志采集模式,是单行模式还是多行模式。
步骤四:创建日志配置组
- 在“日志接入”页面,选择左侧导航栏的“日志配置组”。
- 单击“创建日志配置组”,设置日志配置组参数,配置完成后,单击“确定”。
表4 日志配置组参数说明 参数名称
示例
参数说明
日志配置组名称
appstage-poc-config-01
自定义日志配置组名称。
安装方式
DAEMONSET
选择安装方式,推荐使用“DAEMONSET”。
命名空间
WiseEyePOCMicroServiceA01User
当安装方式为“DAEMONSET”时,需要配置服务日志命名空间。
命名空间为hostpath的下一级目录名称,该目录下48小时内有日志文件更新,才会拉取日志采集配置,必须为英文名。
日志项目
AppStagePOCtest
选择已创建的日志项目。
配置类型
FILEBEAT
选择配置类型,即创建日志采集配置时选择的配置类型,根据配置类型会过滤采集配置列表中的数据。
采集配置列表
appstage_poc_logconfig_01_1736929021008
选择需要下发的配置。
- 参考2再次创建一个日志配置组,参数配置如表5。
表5 日志配置组参数说明 参数名称
示例
参数说明
日志配置组名称
appstage-poc-config-02
自定义日志配置组名称。
安装方式
DAEMONSET
选择安装方式,推荐使用“DAEMONSET”。
命名空间
WiseEyePOCMicroServiceA01Order
当安装方式为“DAEMONSET”时,需要配置服务日志命名空间。
命名空间为hostpath的下一级目录名称,该目录下48小时内有日志文件更新,才会拉取日志采集配置,必须为英文名。
日志项目
AppStagePOCtest
选择已创建的日志项目。
配置类型
FILEBEAT
选择配置类型,即创建日志采集配置时选择的配置类型,根据配置类型会过滤采集配置列表中的数据。
采集配置列表
appstage_poc_logconfig_02_1736929178115
选择需要下发的配置。
步骤五:安装集群插件
步骤六:创建并启动导流任务
- 单击
,选择“运维 > 监控服务(ServiceInsight)”。
- 选择左侧导航栏的 ,进入“数据开发”页面。
- 单击“数据管理 > ClickHouse”,进入ClickHouse页面。
- 选择接入日志的检索空间表,单击“编辑任务”。
图8 编辑任务
- 单击“创建导流任务”,如图9配置导流任务信息,然后单击“确认创建”。
- 在任务列表中选择已创建的导流任务,单击“启动”,然后单击“开始”,启动导流任务,导流任务“实际状态”变更为running。
步骤七:查看采集日志
- 单击
,选择“运维 > 监控服务(ServiceInsight)”。
- 选择左侧导航栏的 。
- 选择需要检索的日志空间,单击“查询”,可以查看采集到的日志。
图10 查看采集日志
步骤八:创建逻辑主体
- 单击
,选择“运维 > 监控服务(ServiceInsight)”。
- 选择左侧导航栏的“运维数据开发 > 数据开发”,进入“数据开发”页面。
- 选择“数据治理 > 指标仓库”。
- 单击逻辑主体后的“新建”。
- 配置逻辑主体参数,参数说明如表6所示,配置完成后,单击“创建”。
表6 配置逻辑主体参数说明 参数类型
参数名称
示例
参数说明
基本信息
英文名称
appstage_poc_index
自定义英文名称。
中文名称
应用平台poc演示指标
自定义中文名称。
数据类型
Service
选择逻辑主体的使用场景,一般为APP、Service、SLB、ELB等,支持自定义数据类型。
字段列表
-
- 字段:count
- 类型:Metric
单击“添加字段”,定义逻辑主体中的字段,可多次单击“添加字段”添加多个字段。
设置字段信息,其中英文名称和类型为必填参数。
数据表
-
- 类型:ClickHouse
- 数据表:ch_appstage_poc_logspace_ootb
- 将所有字段添加至逻辑主体:是
单击“新增”,选择逻辑主体使用的数据表。
选择数据表时需要设置“将所有字段添加至逻辑主体”,如果设置为是,会同步将数据表字段添加到字段列表中;设置为否,列表显示已添加的字段,需要在“数据表字段”列选择数据表字段,将逻辑主体字段与数据表字段关联起来。
步骤十:新建查询视图
- 单击
,选择“运维 > 监控服务(ServiceInsight)”。
- 选择左侧导航栏的“运维数据开发 > 数据开发”,进入“数据开发”页面。
- 选择“数据治理 > 指标仓库”。
- 在“指标仓库”页面,选择需创建视图的逻辑主体,然后单击“新建查询视图”。
- 配置查询视图参数,配置完成后,单击“保存”。
表7 新建查询视图参数说明 参数名称
示例
参数说明
类型
QUERY
视图类型默认为“QUERY”,不可修改。
数据源
ch_appstage_poc_logspace_ootb
选择视图使用的数据表。
英文名称
CH_appstage_poc_all_index
视图名,尽量使用英文简写,不超过50个字符,单词之间使用下划线分隔。
中文名称
CH_应用平台poc演示_所有指标
视图中文名,不超过20个字符。
指标
选择步骤九:新建指标中创建的请求量、请求成功数、成功率、时延指标
选择需要计算的指标,可选择单指标或者多个指标。
(可选)步骤十一:申请令牌
如果已配置云服务实例指标并查看监控报表,此步骤可跳过。
- 单击
,选择“运维 > 监控服务(ServiceInsight)”。
- 选择左侧导航栏的“运维数据开发 > 数据开发”,选择“数据开放 > 令牌管理”,进入“令牌管理”页面。
- 单击“申请令牌”,进入“申请令牌”页面,配置令牌名称,令牌类型,单击“确定”。
- 令牌名称:poctest_token
- 令牌类型:数据开放
- 记录令牌信息,单击“Close”,并记录列表中的令牌ID。
- 新增业务报表数据源。
- 在监控服务左侧导航栏选择“监控 > 报表开发”。
- 单击左下角的“设置和帮助”,然后选择“数据源修改”。
- 单击“添加”。
- 设置数据源,如表8所示,设置完成后,单击“保存”。
图16 新增业务报表数据源
表8 数据源参数说明 参数名称
示例
参数说明
数据源类型
warehouse
选择数据源类型。
- oapclickhouse、oapdruid、oapinfluxdb、oapmppdb、oaptsdb:选择数据源后,可以使用clickhouse、druid等数据源基于SQL配置图表。
- warehouse:选择warehouse类型后,可以基于数仓中创建的指标或视图配置图表。
令牌ID
填写4中获取的令牌ID“6b0d23be42a84b448344c3882557d3c2”
填写已申请的令牌ID。
口令
填写4中获取的口令“44AB9FFF11467938707CFBC6C8F0BEE218ED38DB8D37AA1B6741BB4A4883BF41”
填写申请的令牌。
- 单击“保存”。
步骤十二:创建报表页面
- 单击
,选择“运维 > 监控服务(ServiceInsight)”。
- 选择左侧导航栏的“监控 > 报表开发”,在业务报表编辑页面,单击左下角的“设置和帮助”,然后选择“新增页面”,参数配置完成后单击“确定”。
图17 新增页面
表9 新增页面参数说明 参数
示例
说明
类型
页面
选择“页面”类型,新增业务报表页面。
名称
应用平台POC演示
输入页面名称,长度在1~20个字符。
英文名称
AppStagePocShow
输入页面英文名称,可以输入英文字符以及英文符,数字。
添加到分类
无分类
可以选择无分类,或者已新增的分类。
页面类型
瀑布流页面
选择需要创建的页面类型。
- 瀑布流页面:最常用的页面类型,即常见的报表页面。
- 自由布局页面:支持创建自由布局页面。
- 页面跳转:日志检索常用类型,需要设置一个url地址。
- 轮播页面:轮播大屏,可以将已创建的页面进行轮播。需要设置轮播间隔,并在轮播页面选择已创建页面。
- Tab页页面:可以将已创建的页面以标签页进行呈现。在页面选择下单击“添加”,设置标签页名称并选择相关页面,多次添加完成标签页设置。
- 共享页面:支持添加其他服务已共享的页面。选择已共享的页面并输入url参数。
- mdrca页面:支持创建mdrca页面。
- 告警总览页面:支持将告警数据进行大屏展示。
- 根因诊断页面:支持将根因诊断数据进行大屏展示。
- UEO页面:支持创建UEO页面。
- 自定义页面:支持自定义页面,可以选择对应的页面id。
- 华为云资源监控大盘:支持查看华为云已购买资源实例的数量、状态及费用。
步骤十三:配置并查看数仓图表
- 按指标配置图表。
- 单击
,选择“运维 > 监控服务(ServiceInsight)”。
- 选择左侧导航栏的“监控 > 报表开发”。
- 选择步骤十二:创建报表页面中创建的报表“应用平台POC演示”,单击“配置数仓图表”。
- 配置方式选择“按指标”,分别配置请求量、成功率、时延的报表。
- 配置请求量Block图。
- 单击“添加”,逻辑主体选择步骤八:创建逻辑主体中创建的“appstage_poc_index”,指标选择步骤九:新建指标中创建的“poctest_请求量”,数据类型选择“CH”。
- 单击“编辑”。
- 在“编辑图表”弹框中填写名称“应用平台poc演示_请求量”,标题为“请求量”,英文标题为“appstage_pocshow_requestcount”,图表类型选择“Block”,显示同比选择“是”。
- 单击“预览”查看图表显示是否正常,确认无误后单击“保存”。
- 配置请求量折线图。
- 单击“添加”,逻辑主体选择步骤八:创建逻辑主体中创建的“appstage_poc_index”,指标选择步骤九:新建指标中创建的“poctest_请求量”,数据类型选择“CH”。
- 单击“编辑”。
- 在“编辑图表”弹框中填写名称“应用平台poc演示_请求量趋势图”,标题为“请求量趋势”,英文标题为“appstage_pocshow_runchart”,图表类型选择“折线图”,左Y轴字段选择“poctest_请求量”。
- 单击“预览”查看图表显示是否正常,确认无误后单击“保存”。
- 配置成功率Block图。
- 单击“添加”,逻辑主体选择步骤八:创建逻辑主体中创建的“appstage_poc_index”,指标选择步骤九:新建指标中创建的“poctest_请求成功率”,数据类型选择“CH”。
- 单击“编辑”。
- 在“编辑图表”弹框中填写名称“应用平台poc演示_成功率”,标题为“成功率”,英文标题为“appstage_pocshow_success_rate”,图表类型选择“Block”,类型选择“百分比”,显示同比选择“是”。
- 单击“预览”查看图表显示是否正常,确认无误后单击“保存”。
- 配置成功率折线图。
- 单击“添加”,逻辑主体选择步骤八:创建逻辑主体中创建的“appstage_poc_index”,指标选择步骤九:新建指标中创建的“poctest_请求成功率”,数据类型选择“CH”。
- 单击“编辑”。
- 在“编辑图表”弹框中填写名称“应用平台poc演示_请求成功率趋势”,标题“请求成功率趋势”,英文标题“appstage_pocshow_request_success_rate_run_chart”,图表类型选择“折线图”,左Y轴字段选择“poctest_请求成功率”。
- 单击“预览”查看图表显示是否正常,确认无误后单击“保存”。
- 配置时延。
- 单击“添加”,逻辑主体选择步骤八:创建逻辑主体中创建的“appstage_poc_index”,指标选择步骤九:新建指标中创建的“poctest_时延”,数据类型选择“CH”。
- 单击“编辑”。
- 在“编辑图表”弹框中填写名称为“应用平台poc演示_平均时延”,标题为“平均时延”,英文标题“appstage_pocshow_avg_delay”,图表类型选择“Block”,小数精度设置为“2”,单位为“毫秒”,显示同比选择为“是”。
- 单击“预览”查看图表显示是否正常,确认无误后单击“保存”。
- 上述指标配置完成后,单击“确定”。
- 在“应用平台POC演示”报表中即可看到已创建的图表,可以将图表拖拉缩放至合适大小进行展示,单击“保存”。
- 单击
- 按视图配置图表。
- 选择步骤十二:创建报表页面中创建的报表“应用平台POC演示”,单击“配置数仓图表”。
- 配置方式选择“按视图”,配置接口详情图表。
- 单击“添加”,视图名称选择步骤十:新建查询视图中创建的“CH_应用平台poc演示_所有指标”。
- 单击“编辑”。
- 填写标题“接口详情”,英文标题“api_message”,图表类型选择“表格”,分组字段选择“request_url”,单击计算属性“自动获取”。
- 展开“poctest_request_succrate”属性信息,类型选择“百分比”,小数精度为“2”,其余属性均只修改列名为“接口名”、“请求成功率”、“请求总数”、“平均时延”和“请求成功数”。
- 默认排序字段选择“poctest_request_succrate(请求成功率)”,刷新间隔选择“1分钟”。
- 单击“预览”查看图表显示是否正常,确认无误后单击“保存”。
- 上述视图配置完成后,单击“确定”。
- 在“应用平台POC演示”报表中即可看到已创建的视图,可以将视图拖拉缩放至合适大小进行展示,单击“保存”。
- 配置告警列表。
- 单击左下角的“设置和帮助”,选择“告警配置”,然后单击“保存”。
- 进入步骤十二:创建报表页面中创建的报表“应用平台POC演示”,单击“配置图表”。
- 勾选“_alertlist-_alert”,选择
移动至当前页面图表,单击“确定”。
- 配置完成后将会展示告警列表,其中告警列表相关数据需要AI异常检测场景配置完成后触发,具体请参考使用AI异常检测技术实现业务故障分钟级定位及恢复。
图18 告警列表
- 配置查询条件。
- 选择左侧导航栏的“监控 > 报表开发”,进入步骤十二:创建报表页面中创建的报表“应用平台POC演示”,单击“配置查询条件”。
- 参考图19配置查询条件参数,然后单击“确定”。
- 图20即为已配置的查询条件。
- 发布业务报表。
- 进入步骤十二:创建报表页面中创建的报表“应用平台POC演示”。
- 单击“保存”,保存已开发的业务报表。
- 单击“发布”,发布业务报表。
- 查看业务报表。
业务报表发布成功后,服务下所有用户可以在“业务报表”页面查看该报表。