应用运维管理 AOM
应用运维管理 AOM
- 最新动态
- 功能总览
- 产品介绍(2.0)
- 计费说明(2.0)
- 快速入门(2.0)
-
用户指南(2.0)
- 通过IAM授予使用AOM的权限
- 接入AOM
- 接入AOM(新版)
- 可观测指标浏览
- 仪表盘监控
- 告警监控
- 日志管理(新版)
- 日志管理(旧版)
-
Prometheus监控
- Prometheus监控概述
- 管理Prometheus实例
- 管理Prometheus实例指标数据
- 使用Prometheus监控CCE集群指标
- 配置多账号聚合实现指标统一监控
- 配置CCE集群监控采集指标规则
- 配置预聚合规则提升指标查询效率
- 配置数据多写实现监控指标转储到自建Prometheus
- 配置指标存储时长
- 通过仪表盘监控Prometheus实例指标数据
- 配置Remote Read地址实现自建Prometheus读取AOM的Prometheus数据
- 配置Remote Write地址实现自建Prometheus数据上报到AOM
- 通过Grafana查看Prometheus实例数据
- 查看Prometheus实例指标上报量
- 基础设施监控
- 智能洞察(BETA)
- 应用洞察
- 运维管理
- 全局设置
- 查看AOM审计事件
- 迁移AOM 1.0数据至AOM 2.0
- 最佳实践(2.0)
- 常见问题(2.0)
- API参考
- SDK参考
- 产品介绍(1.0)
- 快速入门(1.0)
- 用户指南(1.0)
- 最佳实践(1.0)
-
常见问题(1.0)
- 用户高频问题
- 常见咨询问题
-
常见使用问题
- 没有消息通知服务的访问权限?
- 资源运行异常怎么办?
- 如何设置全屏模式在线时长?
- 日志配额已达到90%或已满怎么办?
- 如何获取AK/SK?
- 如何查询服务不可用时间?
- AOM告警规则状态为什么显示“数据不足”?
- 正常状态的工作负载,AOM界面显示异常是什么原因?
- 如何创建委托apm_admin_trust?
- 如何通过创建委托获取AK/SK?
- 日志费用说明
- 在控制台查看不到日志怎么办?
- 如何处理界面“ICAgent状态”为“离线”的问题?
- 安装了ICAgent,但是监控不到主机是什么原因?
- 安装ICAgent过程中,系统提示“no crontab for root”是什么原因?
- AOM配置日志转储时无法选中obs桶是什么原因?
- Grafana无法展示内容是什么原因?
- 视频帮助(1.0)
-
更多文档
- 用户指南(1.0)(吉隆坡区域)
- 用户指南(2.0)(吉隆坡区域)
- API参考(吉隆坡区域)
- 用户指南(阿布扎比区域)
- API参考(阿布扎比区域)
- 用户指南(安卡拉区域)
- API参考(安卡拉区域)
- 通用参考
链接复制成功!
将Prometheus的数据上报到AOM
如果您已经部署并正在使用开源prometheus,可直接进行步骤三。
本章主要介绍通过部署Prometheus将AccessCode配置到Prometheus的配置文件并使之生效。
前提条件
已创建弹性云服务器ECS。
操作步骤
- 安装并启动Prometheus,具体操作请参见Prometheus官方文档。
- 添加AccessCode。
- 登录AOM控制台,在菜单栏选择“监控中心”,进入“监控中心”界面。
- 在左侧导航栏中选择“全局配置”。
- 在右侧区域单击“创建AccessCode”,
- 在弹出的“创建AccessCode”对话框中单击“立即生成”,系统自动为当前用户生成AccessCode。
- 添加成功后,单击
即可查看AccessCode。也可单击“删除”,删除AccessCode(删除后无法恢复,请谨慎操作)。
- 获取Remote Write Prometheus配置代码。
- 登录AOM控制台,在菜单栏选择“监控中心”,进入“监控中心”界面。
- 在左侧导航栏选择“Prometheus监控”,在实例列表中单击目标Prometheus实例名称。
- 从“Prometheus配置代码”区域,获取当前Prometheus实例的Remote Write Prometheus配置代码。
- 登录ECS,找到prometheus的配置文件。
示例:如果通过以下命令启动
./prometheus --config.file=prometheus.yml
找到prometheus.yml,将3获取的Remote Write Prometheus配置代码添加到末尾。
一个完整的配置示意如下,您需要配置斜体部分:
# my global config global: scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute. evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute. # scrape_timeout is set to the global default (10s). # Alertmanager configuration alerting: alertmanagers: - static_configs: - targets: # - alertmanager:9093 # Load rules once and periodically evaluate them according to the global 'evaluation_interval'. rule_files: # - "first_rules.yml" # - "second_rules.yml" # A scrape configuration containing exactly one endpoint to scrape: # Here it's Prometheus itself. scrape_configs: # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config. - job_name: 'prometheus' # metrics_path defaults to '/metrics' # scheme defaults to 'http'. static_configs: - targets: ['localhost:9090'] remote_write: - url: 'https://${POD_LB_IP}:8149/v1/{project_id}/{prometheus_instance}/push' tls_config: insecure_skip_verify: true bearer_token: 'SE**iH'
- 检查内网域名配置
由于上述配置中的数据上报是通过内网进行数据传输,因此需要确保您的Prometheus所在的主机能够解析内网域名。
- 重新启动Prometheus。
- 可通过通过grafana查看AOM中的指标数据中grafana查询指标数据的方法,来验证上述配置修改后数据上报是否成功。
父主题: 接入管理