网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
企业路由器 ER
企业交换机 ESW
全球加速 GA
企业连接 EC
云原生应用网络 ANC
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
威胁检测服务 MTD
态势感知 SA
认证测试中心 CTC
边缘安全 EdgeSec
应用中间件
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
API网关 APIG
分布式缓存服务 DCS
多活高可用服务 MAS
事件网格 EG
管理与监管
统一身份认证服务 IAM
消息通知服务 SMN
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云日志服务 LTS
云审计服务 CTS
标签管理服务 TMS
配置审计 Config
应用身份管理服务 OneAccess
资源访问管理 RAM
组织 Organizations
资源编排服务 RFS
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
解决方案
高性能计算 HPC
SAP
混合云灾备
开天工业工作台 MIW
Haydn解决方案工厂
数字化诊断治理专家服务
云生态
云商店
合作伙伴中心
华为云开发者学堂
华为云慧通差旅
开发与运维
软件开发生产线 CodeArts
需求管理 CodeArts Req
流水线 CodeArts Pipeline
代码检查 CodeArts Check
编译构建 CodeArts Build
部署 CodeArts Deploy
测试计划 CodeArts TestPlan
制品仓库 CodeArts Artifact
移动应用测试 MobileAPPTest
CodeArts IDE Online
开源镜像站 Mirrors
性能测试 CodeArts PerfTest
应用管理与运维平台 ServiceStage
云应用引擎 CAE
开源治理服务 CodeArts Governance
华为云Astro轻应用
CodeArts IDE
Astro工作流 AstroFlow
代码托管 CodeArts Repo
漏洞管理服务 CodeArts Inspector
联接 CodeArtsLink
软件建模 CodeArts Modeling
Astro企业应用 AstroPro
CodeArts 盘古助手
华为云Astro大屏应用
计算
弹性云服务器 ECS
Flexus云服务
裸金属服务器 BMS
云手机服务器 CPH
专属主机 DeH
弹性伸缩 AS
镜像服务 IMS
函数工作流 FunctionGraph
云耀云服务器(旧版)
VR云渲游平台 CVR
Huawei Cloud EulerOS
网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
企业路由器 ER
企业交换机 ESW
全球加速 GA
企业连接 EC
云原生应用网络 ANC
CDN与智能边缘
内容分发网络 CDN
智能边缘云 IEC
智能边缘平台 IEF
CloudPond云服务
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
威胁检测服务 MTD
态势感知 SA
认证测试中心 CTC
边缘安全 EdgeSec
大数据
MapReduce服务 MRS
数据湖探索 DLI
表格存储服务 CloudTable
可信智能计算服务 TICS
推荐系统 RES
云搜索服务 CSS
数据可视化 DLV
数据接入服务 DIS
数据仓库服务 GaussDB(DWS)
数据治理中心 DataArts Studio
湖仓构建 LakeFormation
智能数据洞察 DataArts Insight
应用中间件
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
API网关 APIG
分布式缓存服务 DCS
多活高可用服务 MAS
事件网格 EG
开天aPaaS
应用平台 AppStage
开天企业工作台 MSSE
开天集成工作台 MSSI
API中心 API Hub
云消息服务 KooMessage
交换数据空间 EDS
云地图服务 KooMap
云手机服务 KooPhone
组织成员账号 OrgID
云空间服务 KooDrive
管理与监管
统一身份认证服务 IAM
消息通知服务 SMN
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云日志服务 LTS
云审计服务 CTS
标签管理服务 TMS
配置审计 Config
应用身份管理服务 OneAccess
资源访问管理 RAM
组织 Organizations
资源编排服务 RFS
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
区块链
区块链服务 BCS
数字资产链 DAC
华为云区块链引擎服务 HBS
解决方案
高性能计算 HPC
SAP
混合云灾备
开天工业工作台 MIW
Haydn解决方案工厂
数字化诊断治理专家服务
价格
成本优化最佳实践
专属云商业逻辑
云生态
云商店
合作伙伴中心
华为云开发者学堂
华为云慧通差旅
其他
管理控制台
消息中心
产品价格详情
系统权限
客户关联华为云合作伙伴须知
公共问题
宽限期保留期
奖励推广计划
活动
云服务信任体系能力说明
开发与运维
软件开发生产线 CodeArts
需求管理 CodeArts Req
流水线 CodeArts Pipeline
代码检查 CodeArts Check
编译构建 CodeArts Build
部署 CodeArts Deploy
测试计划 CodeArts TestPlan
制品仓库 CodeArts Artifact
移动应用测试 MobileAPPTest
CodeArts IDE Online
开源镜像站 Mirrors
性能测试 CodeArts PerfTest
应用管理与运维平台 ServiceStage
云应用引擎 CAE
开源治理服务 CodeArts Governance
华为云Astro轻应用
CodeArts IDE
Astro工作流 AstroFlow
代码托管 CodeArts Repo
漏洞管理服务 CodeArts Inspector
联接 CodeArtsLink
软件建模 CodeArts Modeling
Astro企业应用 AstroPro
CodeArts 盘古助手
华为云Astro大屏应用
存储
对象存储服务 OBS
云硬盘 EVS
云备份 CBR
高性能弹性文件服务 SFS Turbo
弹性文件服务 SFS
存储容灾服务 SDRS
云硬盘备份 VBS
云服务器备份 CSBS
数据快递服务 DES
云存储网关 CSG
专属分布式存储服务 DSS
数据工坊 DWR
地图数据 MapDS
键值存储服务 KVS
容器
云容器引擎 CCE
云容器实例 CCI
容器镜像服务 SWR
云原生服务中心 OSC
应用服务网格 ASM
华为云UCS
数据库
云数据库 RDS
数据复制服务 DRS
文档数据库服务 DDS
分布式数据库中间件 DDM
云数据库 GaussDB
云数据库 GeminiDB
数据管理服务 DAS
数据库和应用迁移 UGO
云数据库 TaurusDB
人工智能
AI开发平台ModelArts
华为HiLens
图引擎服务 GES
图像识别 Image
文字识别 OCR
自然语言处理 NLP
内容审核 Moderation
图像搜索 ImageSearch
医疗智能体 EIHealth
企业级AI应用开发专业套件 ModelArts Pro
人脸识别服务 FRS
对话机器人服务 CBS
语音交互服务 SIS
人证核身服务 IVS
视频智能分析服务 VIAS
城市智能体
自动驾驶云服务 Octopus
盘古大模型 PanguLargeModels
IoT物联网
设备接入 IoTDA
全球SIM联接 GSL
IoT数据分析 IoTA
路网数字化服务 DRIS
IoT边缘 IoTEdge
设备发放 IoTDP
企业应用
域名注册服务 Domains
云解析服务 DNS
企业门户 EWP
ICP备案
商标注册
华为云WeLink
华为云会议 Meeting
隐私保护通话 PrivateNumber
语音通话 VoiceCall
消息&短信 MSGSMS
云管理网络
SD-WAN 云服务
边缘数据中心管理 EDCM
云桌面 Workspace
应用与数据集成平台 ROMA Connect
ROMA资产中心 ROMA Exchange
API全生命周期管理 ROMA API
政企自服务管理 ESM
视频
实时音视频 SparkRTC
视频直播 Live
视频点播 VOD
媒体处理 MPC
视频接入服务 VIS
数字内容生产线 MetaStudio
迁移
主机迁移服务 SMS
对象存储迁移服务 OMS
云数据迁移 CDM
迁移中心 MGC
专属云
专属计算集群 DCC
开发者工具
SDK开发指南
API签名指南
DevStar
华为云命令行工具服务 KooCLI
Huawei Cloud Toolkit
CodeArts API
云化转型
云架构中心
云采用框架
用户服务
账号中心
费用中心
成本中心
资源中心
企业管理
工单管理
客户运营能力
国际站常见问题
支持计划
专业服务
合作伙伴支持计划
我的凭证
华为云公共事业服务云平台
工业软件
工业数字模型驱动引擎
硬件开发工具链平台云服务
工业数据转换引擎云服务
更新时间:2024-10-10 GMT+08:00
分享

Doris集群支持的监控指标

功能说明

监控是保持CloudTable服务可靠性、可用性和性能的重要部分,通过监控,用户可以观察CloudTable服务器的运行状态。本章节定义了表格存储服务上报云监控服务的监控指标的命名空间、监控指标列表和维度定义。

命名空间

SYS.CloudTable/Service.CloudTable

FE节点支持的监控指标

FE节点监控指标如表1所示。

表1 FE节点支持的监控指标

指标名称

显示名称

含义

取值范围

监控周期(原始指标)

命名空间

doris_fe_image_clean_failed

清理历史元数据镜像文件失败的次数

不应失败,如失败,需人工介入

≥0

60s

SYS.CloudTable

doris_fe_image_clean_success

清理历史元数据镜像文件成功的次数

-

≥0

60s

SYS.CloudTable

doris_fe_image_push_success

将元数据镜像文件推送给其他FE节点的成功的次数

-

≥0

60s

SYS.CloudTable

doris_fe_image_write_failed

生成元数据镜像文件失败的次数

不应失败,如失败,需人工介入

≥0

60s

SYS.CloudTable

doris_fe_image_write_success

生成元数据镜像文件成功的次数

-

≥0

60s

SYS.CloudTable

doris_fe_max_journal_id

当前FE节点最大元数据日志ID

如果是Master FE,则是当前写入的最大ID,如果是非Master FE,则代表当前回放的元数据日志最大ID;用于观察多个FE之间的id是否差距过大,过大则表示元数据同步出现问题。

≥0

60s

SYS.CloudTable

doris_fe_max_tablet_compaction_score

所有BE节点中最大的compaction score值

该值可以观测当前集群最大的 compaction score,以判断是否过高,如过高则可能出现查询或写入延迟。

≥0

60s

SYS.CloudTable

doris_fe_qps

当前FE每秒查询数量(仅统计查询请求)

QPS

≥0

60s

SYS.CloudTable

doris_fe_query_err

错误查询的累积值

-

≥0

60s

SYS.CloudTable

doris_fe_query_err_rate

每秒错误查询数

-

≥0

60s

SYS.CloudTable

doris_fe_query_latency_ms_99

查询请求延迟的99分位的查询延迟

-

≥0 ms

60s

SYS.CloudTable

doris_fe_query_latency_ms_999

查询请求延迟的999分位的查询延迟

-

≥0 ms

60s

SYS.CloudTable

doris_fe_query_olap_table

查询内部表(OlapTable)的请求个数

-

≥0

60s

SYS.CloudTable

doris_fe_query_total

所有查询请求数

-

≥0

60s

SYS.CloudTable

doris_fe_report_queue_size

BE的各种定期汇报任务在FE端的队列长度

该值反映了汇报任务在 Master FE 节点上的阻塞程度,数值越大,表示FE处理能力不足。

≥0

60s

SYS.CloudTable

doris_fe_request_total

所有通过MySQL端口接收的操作请求(包括查询和其他语句)

-

≥0

60s

SYS.CloudTable

doris_fe_routine_load_error_rows

集群内所有Routine Load作业的错误行数总和

-

≥0

60s

SYS.CloudTable

doris_fe_routine_load_receive_bytes

集群内所有Routine Load作业接收的数据量大小

-

≥0 Byte

60s

SYS.CloudTable

doris_fe_routine_load_rows

集群内所有Routine Load作业接收的数据行数

-

≥0

60s

SYS.CloudTable

doris_fe_rps

当前FE每秒请求数量(包含查询以及其他各类语句)

和 QPS 配合来查看集群处理请求的量。

≥0

60s

SYS.CloudTable

doris_fe_scheduled_tablet_num

Master FE节点正在调度的tablet数量

包括正在修复的副本和正在均衡的副本;该数值可以反映当前集群,正在迁移的 tablet 数量;如果长时间有值,说明集群不稳定。

≥0

60s

SYS.CloudTable

doris_fe_tablet_status_count_added

Master FE节点被调度过的tablet数量

-

≥0

60s

SYS.CloudTable

doris_fe_tablet_status_count_in_sched

Master FE节点被重复调度的tablet数量

-

≥0

60s

SYS.CloudTable

doris_fe_tablet_status_count_not_ready

Master FE节点未满足调度触发条件的tablet数量

-

≥0

60s

SYS.CloudTable

doris_fe_tablet_status_count_total

Master FE节点的被检查过的tablet数量

-

≥0

60s

SYS.CloudTable

doris_fe_tablet_status_count_unhealthy

Master FE节点累积的被检查过的不健康的tablet数量

-

≥0

60s

SYS.CloudTable

doris_fe_txn_counter_begin

提交的事务数量

-

≥0

60s

SYS.CloudTable

doris_fe_txn_counter_failed

失败的事务数量

-

≥0

60s

SYS.CloudTable

doris_fe_txn_counter_reject

被拒绝的事务数量

如当前运行事务数大于阈值,则新的事务会被拒绝。

≥0

60s

SYS.CloudTable

doris_fe_txn_counter_success

成功的事务数量

-

≥0

60s

SYS.CloudTable

doris_fe_txn_exec_latency_ms_99

99分位的事务执行耗时

-

≥0 ms

60s

SYS.CloudTable

doris_fe_txn_exec_latency_ms_999

999分位的事务执行耗时

-

≥0 ms

60s

SYS.CloudTable

doris_fe_txn_publish_latency_ms_99

99分位的事务publish耗时

-

≥0 ms

60s

SYS.CloudTable

doris_fe_txn_publish_latency_ms_999

999分位的事务publish耗时

-

≥0 ms

60s

SYS.CloudTable

jvm_heap_size_bytes_max

最大堆内存

观测JVM内存使用情况。

≥0 Byte

60s

SYS.CloudTable

jvm_heap_size_bytes_committed

已申请的堆内存

观测JVM内存使用情况。

≥0 Byte

60s

SYS.CloudTable

jvm_heap_size_bytes_used

已使用的堆内存

观测JVM内存使用情况。

≥0 Byte

60s

SYS.CloudTable

jvm_non_heap_size_bytes_committed

已申请的堆外内存

-

≥0 Byte

60s

SYS.CloudTable

jvm_non_heap_size_bytes_used

已使用堆外内存

-

≥0 Byte

60s

SYS.CloudTable

jvm_old_gc_coun

老年代GC次数

观测是否出现长时间的FullGC。

≥0

60s

SYS.CloudTable

jvm_old_gc_time

老年代GC耗时

观测是否出现长时间的FullGC。

≥0 ms

60s

SYS.CloudTable

jvm_old_size_bytes_used

老年代内存占用

-

≥0 Byte

60s

SYS.CloudTable

jvm_old_size_bytes_peak_used

老年代内存占用峰值

-

≥0 Byte

60s

SYS.CloudTable

jvm_old_size_bytes_max

老年代内存最大值

-

≥0 Byte

60s

SYS.CloudTable

jvm_thread_new_count

线程数峰值

观测JVM线程数是否合理。

≥0

60s

SYS.CloudTable

jvm_thread_new_count

new状态的线程数

观测JVM线程数是否合理。

≥0

60s

SYS.CloudTable

jvm_thread_runnable_count

runnable状态的线程数

观测JVM线程数是否合理。

≥0

60s

SYS.CloudTable

jvm_thread_blocked_count

blocked状态的线程数

观测JVM线程数是否合理。

≥0

60s

SYS.CloudTable

jvm_thread_waiting_count

waiting状态的线程数

观测JVM线程数是否合理。

≥0

60s

SYS.CloudTable

jvm_thread_terminated_coun

terminated状态的线程数

观测JVM线程数是否合理。

≥0

60s

SYS.CloudTable

jvm_young_gc_count

新生代GC次数

累计值

≥0

60s

SYS.CloudTable

jvm_young_gc_time

新生代GC耗时

累计值

≥0 ms

60s

SYS.CloudTable

jvm_young_size_bytes_used

新生代内存占用

-

≥0 Byte

60s

SYS.CloudTable

jvm_young_size_bytes_peak_used

新生代内存占用峰值

-

≥0 Byte

60s

SYS.CloudTable

jvm_young_size_bytes_max

新生代内存最大值

-

≥0 Byte

60s

SYS.CloudTable

doris_fe_cache_added_partition

新增的Partition Cache数量

累计值

≥0

60s

SYS.CloudTable

doris_fe_cache_added_sql

新增的SQL Cache数量

累计值

≥0

60s

SYS.CloudTable

doris_fe_cache_hit_partition

命中Partition Cache数

-

≥0

60s

SYS.CloudTable

doris_fe_cache_hit_sql

命中SQL Cache数

-

≥0

60s

SYS.CloudTable

doris_fe_connection_total

当前FE的MySQL端口连接数

用于监控查询连接数。如果连接数超限,则新的连接将无法接入

≥0

60s

SYS.CloudTable

doris_fe_counter_hit_sql_block_rule

被SQL BLOCK RULE拦截的查询数量

-

≥0

60s

SYS.CloudTable

doris_fe_edit_log_clean_failed

清理历史元数据日志失败的次数

不应失败,如失败,需人工介入。

≥0

60s

SYS.CloudTable

doris_fe_edit_log_clean_success

清理历史元数据日志成功的次数

-

≥0

60s

SYS.CloudTable

doris_fe_edit_log_read

元数据日志读取次数的计数

通过斜率观察元数据读取频率是否正常。

≥0

60s

SYS.CloudTable

doris_fe_edit_log_write

元数据日志写入次数的计数

通过斜率观察元数据读取频率是否正常。

≥0

60s

SYS.CloudTable

doris_fe_image_push_failed

将元数据镜像文件推送给其他FE节点的失败的次数

-

≥0

60s

SYS.CloudTable

doris_fe_thrift_rpc_total_{method_name}

doris_fe_thrift_rpc_total_{method_name}

FE thrift接口各个方法接收的RPC请求次数

≥0

60s

Service.CloudTable

doris_fe_thrift_rpc_latency_ms_{method_name}

doris_fe_thrift_rpc_latency_ms_{method_name}

FE thrift接口各个方法接收的RPC请求耗时

≥0

60s

Service.CloudTable

doris_fe_thread_pool_thrift_server_pool_active_thread_num

doris_fe_thread_pool_thrift_server_pool_active_thread_num

线程池thrift-server-pool正在执行的任务数

≥0

60s

Service.CloudTable

doris_fe_thread_pool_thrift_server_pool_active_thread_pct

doris_fe_thread_pool_thrift_server_pool_active_thread_pct

线程池thrift-server-pool正在执行的任务数占最大线程数的百分比

[0%,100%]

60s

Service.CloudTable

doris_fe_thread_pool_thrift_server_pool_task_in_queue

doris_fe_thread_pool_thrift_server_pool_task_in_queue

线程池thrift-server-pool正在排队的任务数

≥0

60s

Service.CloudTable

doris_fe_thread_pool_thrift_server_pool_task_rejected

doris_fe_thread_pool_thrift_server_pool_task_rejected

线程池thrift-server-pool拒绝的任务数

≥0

60s

Service.CloudTable

doris_fe_thread_pool_mysql_nio_pool_active_thread_num

doris_fe_thread_pool_mysql_nio_pool_active_thread_num

线程池mysql-nio-pool正在执行的任务数

≥0

60s

Service.CloudTable

doris_fe_thread_pool_mysql_nio_pool_active_thread_pct

doris_fe_thread_pool_mysql_nio_pool_active_thread_pct

线程池mysql-nio-pool正在执行的任务数占最大线程数的百分比

[0%,100%]

60s

Service.CloudTable

doris_fe_thread_pool_mysql_nio_pool_task_in_queue

doris_fe_thread_pool_mysql_nio_pool_task_in_queue

线程池mysql-nio-pool正在排队的任务数

≥0

60s

Service.CloudTable

doris_fe_thread_pool_mysql_nio_pool_task_rejected

doris_fe_thread_pool_mysql_nio_pool_task_rejected

线程池mysql-nio-pool拒绝的任务数

≥0

60s

Service.CloudTable

doris_fe_thread_pool_connect_scheduler_pool_active_thread_num

doris_fe_thread_pool_connect_scheduler_pool_active_thread_num

线程池connect-scheduler-pool正在执行的任务数

≥0

60s

Service.CloudTable

doris_fe_thread_pool_connect_scheduler_pool_active_thread_pct

doris_fe_thread_pool_connect_scheduler_pool_active_thread_pct

线程池connect-scheduler-pool正在执行的任务数占最大线程数的百分比

[0%,100%]

60s

Service.CloudTable

doris_fe_thread_pool_connect_scheduler_pool_task_in_queue

doris_fe_thread_pool_connect_scheduler_pool_task_in_queue

线程池connect-scheduler-pool正在排队的任务数

≥0

60s

Service.CloudTable

doris_fe_thread_pool_connect_scheduler_pool_task_rejected

doris_fe_thread_pool_connect_scheduler_pool_task_rejected

线程池connect-scheduler-pool拒绝的任务数

≥0

60s

Service.CloudTable

BE节点支持的监控指标

BE节点监控指标如表2所示。

表2 BE节点支持的监控指标

指标名称

显示名称

含义

取值范围

监控周期(原始指标)

命名空间

doris_be_active_scan_context_count

由外部直接打开的scanner的个数

-

≥0

60s

SYS.CloudTable

doris_be_add_batch_task_queue_size

接收batch的线程池的队列大小

-

≥0

60s

SYS.CloudTable

doris_be_brpc_endpoint_stub_count

已创建的brpc stub的数量(BE)

这些stub用于BE之间的交互

≥0

60s

SYS.CloudTable

doris_be_brpc_function_endpoint_stub_count

已创建的brpc stub的数量(Remote RPC)

这些stub用于和Remote RPC之间交互

≥0

60s

SYS.CloudTable

doris_be_cache_usage_LastestSuccessChannelCache

LRU ChannelCache使用率

LRU DataPageCache使用率

[0%,100%]

60s

SYS.CloudTable

doris_be_cache_usage_ratio_DataPageCache

LRU DataPageCache使用率

-

[0%,100%]

60s

SYS.CloudTable

doris_be_cache_usage_ratio_IndexPageCache

LRU IndexPageCache使用率

-

[0%,100%]

60s

SYS.CloudTable

doris_be_cache_usage_ratio_SegmentCache

LRU SegmentCache使用率

-

[0%,100%]

60s

SYS.CloudTable

doris_be_cache_hit_ratio_DataPageCache

LRU DataPageCache命中率

数据Cache,直接影响查询效率

[0%,100%]

60s

SYS.CloudTable

doris_be_cache_hit_ratio_IndexPageCache

LRU IndexPageCache命中率

索引Cache,直接影响查询效率

[0%,100%]

60s

SYS.CloudTable

doris_be_cache_hit_ratio_LastestSuccessChannelCache

LRU ChannelCache命中率

-

[0%,100%]

60s

SYS.CloudTable

doris_be_cache_hit_ratio_SegmentCache

LRU SegmentCache命中率

-

[0%,100%]

60s

SYS.CloudTable

doris_be_chunk_pool_local_core_alloc_count

ChunkAllocator中,从绑定的core的内存队列中分配内存的次数

-

≥0

60s

SYS.CloudTable

doris_be_chunk_pool_other_core_alloc_count

ChunkAllocator中,从其他的core的内存队列中分配内存的次数

-

≥0

60s

SYS.CloudTable

doris_be_chunk_pool_reserved_bytes

ChunkAllocator中预留的内存大小

-

≥0 Byte

60s

SYS.CloudTable

doris_be_chunk_pool_system_alloc_cost_ns

SystemAllocator申请内存的耗时

累计值通过斜率可以观测内存分配的耗时

≥0 ns

60s

SYS.CloudTable

doris_be_chunk_pool_system_alloc_count

SystemAllocator申请内存的次数

-

≥0

60s

SYS.CloudTable

doris_be_chunk_pool_system_free_cost_ns

SystemAllocator释放内存的耗时累计值

通过斜率可以观测内存释放的耗时

≥0 ns

60s

SYS.CloudTable

doris_be_chunk_pool_system_free_count

SystemAllocator释放内存的次数

-

≥0

60s

SYS.CloudTable

doris_be_compaction_bytes_total_base

Base Compaction的数据量

累计值

≥0 Byte

60s

SYS.CloudTable

doris_be_compaction_bytes_total_cumulative

Cumulative Compaction的数据量

累计值

≥0

60s

SYS.CloudTable

doris_be_compaction_deltas_total_base

Base Compaction处理的rowset个数

累计值

≥0

60s

SYS.CloudTable

doris_be_compaction_deltas_total_cumulative

Cumulative Compaction处理的rowset个数

累计值

≥0

60s

SYS.CloudTable

doris_be_compaction_waitting_permits

正在等待Compaction令牌的数量

-

≥0

60s

SYS.CloudTable

doris_be_data_stream_receiver_count

数据接收端Receiver的数量

-

≥0

60s

SYS.CloudTable

doris_be_data_stream_receiver_count

数据接收端Receiver的数量

同doris_be_data_stream_receiver_count

≥0

60s

SYS.CloudTable

doris_be_fragment_request_duration_us

所有fragment intance的执行时间

累计值通过斜率观测 instance 的执行耗时

≥0 us

60s

SYS.CloudTable

doris_be_fragment_requests_total

执行过的fragment instance的数量

累计值

≥0

60s

SYS.CloudTable

doris_be_load_channel_count

当前打开的load channel个数

数值越大,说明当前正在执行的导入任务越多

≥0

60s

SYS.CloudTable

doris_be_mem_consumption_tablet_meta

tablet_meta模块的当前总内存开销

-

≥0

60s

SYS.CloudTable

doris_be_mem_consumption_load

load模块的当前总内存开销

-

≥0 Byte

60s

SYS.CloudTable

doris_be_memory_allocated_bytes

TcMalloc占用的虚拟内存的大小

-

≥0 Byte

60s

SYS.CloudTable

doris_be_memory_pool_bytes_total

所有MemPool当前占用的内存大小

-

≥0 Byte

60s

SYS.CloudTable

doris_be_memtable_flush_duration_us

memtable写入磁盘的耗时

累计值通过斜率可以观测写入延迟

≥0 us

60s

SYS.CloudTable

doris_be_memtable_flush_total

memtable写入磁盘的个数

累计值通过斜率可以计算写入文件的频率

≥0

60s

SYS.CloudTable

doris_be_meta_request_duration_read

访问RocksDB中的meta的读取耗时

-

≥0 us

60s

SYS.CloudTable

doris_be_meta_request_duration_write

访问RocksDB中的meta的写入耗时

-

≥0 us

60s

SYS.CloudTable

doris_be_meta_request_total_read

访问RocksDB中的meta的读取次数

累计值

≥0

60s

SYS.CloudTable

doris_be_meta_request_total_write

访问RocksDB中的meta的写入次数

累计值

≥0

60s

SYS.CloudTable

doris_be_plan_fragment_count

当前已接收的fragment instance的数量

观测是否出现instance堆积

≥0

60s

SYS.CloudTable

doris_be_process_fd_num_limit_hard

BE进程的文件句柄数硬限

-

≥0

60s

SYS.CloudTable

doris_be_process_fd_num_limit_soft

BE进程的文件句柄数软限

-

≥0

60s

SYS.CloudTable

doris_be_process_fd_num_used

BE进程已使用的文件句柄数

-

≥0

60s

SYS.CloudTable

doris_be_process_thread_num

BE进程线程数

-

≥0

60s

SYS.CloudTable

doris_be_query_cache_memory_total_byte

Query Cache占用字节数

-

≥0 Byte

60s

SYS.CloudTable

doris_be_query_cache_partition_total_count

当前Partition Cache缓存个数

-

≥0

60s

SYS.CloudTable

doris_be_query_cache_sql_total_count

当前SQL Cache缓存个数

-

≥0

60s

SYS.CloudTable

doris_be_query_scan_bytes

读取数据量的累计值

只统计读取Olap表的数据量

≥0 Byte

60s

SYS.CloudTable

doris_be_query_scan_bytes_per_second

读取速率

-

≥0 Byte/s

60s

SYS.CloudTable

doris_be_query_scan_rows

读取行数

累计值只统计读取Olap表的数据量,通过斜率观测查询速率。

≥0

60s

SYS.CloudTable

doris_be_result_block_queue_count

当前查询结果缓存中的fragment instance个数

该队列仅用于被外部系统直接读取时使用

≥0

60s

SYS.CloudTable

doris_be_result_buffer_block_count

当前查询结果缓存中的query个数

该数值反映当前BE中有多少查询的结果正在等待FE消费

≥0

60s

SYS.CloudTable

doris_be_routine_load_task_count

当前正在执行的routine load task个数

-

≥0

60s

SYS.CloudTable

doris_be_rowset_count_generated_and_in_use

自上次启动后,新增的并且正在使用的rowset id个数

-

≥0

60s

SYS.CloudTable

doris_be_scanner_thread_pool_queue_size

用于OlapScanner的线程池的当前排队数量

-

≥0

60s

SYS.CloudTable

doris_be_segment_read_segment_read_total

读取的segment的个数

累计值

≥0

60s

SYS.CloudTable

doris_be_segment_read_segment_row_total

读取的segment的行数

累计值该数值也包含了被索引过滤的行数

≥0

60s

SYS.CloudTable

doris_be_send_batch_thread_pool_queue_size

导入时用于发送数据包的线程池的排队个数

-

≥0

60s

SYS.CloudTable

doris_be_send_batch_thread_pool_thread_num

导入时用于发送数据包的线程池的线程数

-

≥0

60s

SYS.CloudTable

doris_be_small_file_cache_count

当前BE缓存的小文件数量

-

≥0

60s

SYS.CloudTable

doris_be_streaming_load_current_processing

当前正在运行的stream load任务数

仅包含curl命令发送的任务

≥0

60s

SYS.CloudTable

doris_be_streaming_load_duration_ms

所有stream load任务执行时间的耗时

累计值

≥0

60s

SYS.CloudTable

doris_be_streaming_load_requests_total

stream load任务数

累计值通过斜率可观测任务提交频率。

≥0

60s

SYS.CloudTable

doris_be_stream_load_pipe_count

当前stream load数据管道的个数

包括stream load和routine load任务

≥0

60s

SYS.CloudTable

doris_be_stream_load_load_rows

stream load最终导入的行数

包括stream load和routine load任务

≥0

60s

SYS.CloudTable

doris_be_stream_load_receive_bytes

stream load接收的字节数

包括stream load从http接收的数据,以及routine load从kafka读取的数据。

≥0 Byte

60s

SYS.CloudTable

doris_be_tablet_base_max_compaction_score

当前最大的Base Compaction Score

该数值实时变化,有可能丢失峰值数据;数值越高,表示compaction堆积越严重。

≥0

60s

SYS.CloudTable

doris_be_tablet_cumulative_max_compaction_score

当前最大的Cumulative Compaction Score

-

≥0

60s

SYS.CloudTable

doris_be_thrift_connections_total_heartbeat

心跳服务的连接数

累计值

≥0

60s

SYS.CloudTable

doris_be_thrift_connections_total_backend

BE服务的连接数

累计值

≥0

60s

SYS.CloudTable

doris_be_thrift_current_connections_heartbeat

心跳服务的当前连接数

-

≥0

60s

SYS.CloudTable

doris_be_thrift_current_connections_backend

BE服务的当前连接数

-

≥0

60s

SYS.CloudTable

doris_be_timeout_canceled_fragment_count

因超时而被取消的fragment instance数量

这个值可能会被重复记录

≥0

60s

SYS.CloudTable

doris_be_stream_load_txn_request_begin

stream load开始事务数

包括stream load和routine load任务

≥0

60s

SYS.CloudTable

doris_be_stream_load_txn_request_commit

stream load执行成功的事务数

包括stream load和routine load任务

≥0

60s

SYS.CloudTable

doris_be_stream_load_txn_request_rollback

stream load执行失败的事务数

包括stream load和routine load任务

≥0

60s

SYS.CloudTable

doris_be_unused_rowsets_count

当前已废弃的rowset的个数

这些rowset正常情况下会被定期删除

≥0

60s

SYS.CloudTable

doris_be_load_bytes

通过tablet sink发送的数量

累计值可观测导入数据量

≥0 Byte

60s

SYS.CloudTable

doris_be_load_rows

通过tablet sink发送的行数

累计值可观测导入数据量

≥0 Byte

60s

SYS.CloudTable

doris_be_fragment_thread_pool_queue_size

当前查询执行线程池等待队列的长度

-

≥0

60s

SYS.CloudTable

doris_be_compaction_used_permits

Compaction任务已使用的令牌数量

用于反映Compaction的资源消耗量

≥0

60s

SYS.CloudTable

doris_be_upload_total_byte

rowset数据量累计值

-

≥0

60s

SYS.CloudTable

light_work_active_threads

light_work_active_threads

brpc light线程池活跃线程数

≥0

60s

Service.CloudTable

light_work_pool_queue_size

light_work_pool_queue_size

brpc light线程池队列最大长度,超过则阻塞提交work

≥0

60s

Service.CloudTable

fragment_thread_pool_queue_size

fragment_thread_pool_queue_size

当前查询执行线程池等待队列的长度

≥0

60s

Service.CloudTable

process_thread_num

process_thread_num

BE 进程线程数

≥0

60s

Service.CloudTable

维度

Key

Value

cluster_id

CloudTable集群ID。

instance_name

CloudTable集群节点名称。

相关文档