再也不怕半夜被叫醒:用 Prometheus + Alertmanager 实现智能告警

前言

在运维的世界里,最让人崩溃的不是故障本身,而是凌晨三点被刺耳的电话惊醒——只因为一个临时抖动触发了“狼来了”式的无效告警。

我们曾以为监控就是“有数据、能报警”,但随着系统越来越复杂,告警数量爆炸式增长,真正关键的问题反而被淹没在噪音中。误报、重复告警、无法分级通知……不仅消耗精力,更让团队陷入“告警疲劳”,最终对警报麻木。

其实,问题不在 Prometheus,而在于如何聪明地告警。

Prometheus 负责精准采集与评估指标,而 Alertmanager 正是那个帮你“冷静决策”的大脑——它能聚合告警、按严重程度路由、支持静默与抑制、对接多种通知渠道。

本文将带你从实战出发,一步步搭建一套可靠、智能、不扰民的告警体系,让你的监控系统真正成为守护业务的“哨兵”,而不是半夜的“闹钟”。

从此,安心睡觉,把告警交给 Alertmanager。

image-20251111145638563

1.ubuntu安装prometheus实现监控部署

通过以下命令创建一个用于存放 Prometheus 的目录 /app:

mkdir /app

进入到/app目录下:

cd /app

image-20251111145856908

从prometheus官网下载压缩文件:https://prometheus.io/download/

下载适用于Linux系统的文件。

image-20251111150255214

使用的是 MobaXterm_Personal,这是一种功能强大的终端工具,常用于远程连接 Linux 服务器。进入/app下面。点击上传,上传下载好的prometheus压缩文件。

image-20251111150546347

image-20251111151123445

解压缩该文件:

tar -xzvf prometheus-3.7.3.linux-amd64.tar.gz

image-20251111151242288

将解压好的文件夹改一个名字,并删除原有的未解压文件(可以不删):

mv prometheus-3.5.0.linux-amd64 prometheus
rm -rf prometheus-3.5.0.linux-amd64.tar.gz

image-20251111151351047

进入解压好并且改过名的prometheus目录下,查看它的版本。返回版本号代表安装成功!

cd /app/prometheus
./prometheus --version

image-20251111152505492

创建prometheus 本地TSDB数据存储目录:

mkdir -p /var/lib/prometheus

进入这个目录,使用systemctl管理Prometheus:

vim /usr/lib/systemd/system/prometheus.service

写入:

[Unit]
Description=Prometheus
Documentation=https://prometheus.io/
After=network.target

[Service]
Type=simple
User=root
ExecStart=/app/prometheus/prometheus --config.file=/app/prometheus/prometheus.yml --storage.tsdb.path=/var/lib/prometheus --web.enable-lifecycle
ExecReload=/bin/kill -HUP $MAINPID
KillMode=process
Restart=on-failure

[Install]
WantedBy=multi-user.target

image-20251111152640774

  • systemctl enable prometheus

    将 Prometheus 服务设置为 开机自启动。

  • systemctl start prometheus

    立即启动 Prometheus 服务。

  • systemctl status prometheus

    查看 Prometheus 服务的 当前状态。

systemctl enable prometheus 
systemctl start prometheus
systemctl status prometheus

image-20251111152745382

部署完成后,在浏览器中输入 http://极空间IP:9090 就能看到prometheus的界面啦:

image-20251111152826893

2.ubuntu安装alertmanager监控

去官网下载安装文件:https://prometheus.io/download/

找到linux版,下载:

image-20251111162957977

下载完成后记住下载路径。

手动上传到/app下载好的alertmanager文件。

image-20251111163352525

上传成功后解压:

tar -vxzf alertmanager-0.27.0.linux-amd64.tar.gz

image-20251111163436930

改名方便记忆:

mv alertmanager-0.27.0.linux-amd64 alertmanager

image-20251111163605827

将Altermanager配置为系统服务:

cd /usr/lib/systemd/system
vim alertmanager.service
[Unit]
Description=https://prometheus.io

[Service]
Restart=on-failure
ExecStart=/app/alertmanager --config.file=/app/alertmanager.yml

[Install]                      
WantedBy=multi-user.target

image-20251111163655056

加载system文件,启动alertmanager这个服务,并设置开机启动:

systemctl daemon-reload
systemctl start alertmanager.service
systemctl enable alertmanager.service

image-20251111163802935

也可以后台手动启动:

nohup ./alertmanager --config.file=alertmanager.yml >> /app/alertmanager/alertmanager/alertmanager.out 2>&1 &
cat alertmanager.out

启动成功后,访问Altermanager,ip+9093,默认端口为 9093。

image-20251111163904875

3.在prometheus上配置alertmanagerg告警

进入prometheus的配置文件,加入alertmanager告警规则:

vi /app/prometheus/prometheus.yml

Bash

加入以下内容后:Prometheus可以用localhost:9093访问到运行在本地9093端口的Alertmanager服务,从而抓取系统指标。

      - targets: ["localhost:9093"]
        labels:
          app: "alertmanager"

Bash

这一步配置的作用是:告诉 Prometheus,当监控规则触发告警时,应该把告警信息发送到哪个 Alertmanager 服务进行处理(便于一会监控node_exporter,也可以监控mysqld_exporter等等)。

alerting:
  alertmanagers:
    - static_configs:
        - targets: ["localhost:9093"]

image-20251111164441082

打开prometheus监控成功:

image-20251111164508290

后续也可以配置告警规则。

但是目前我们只能在自己电脑上进行监控,倘若公司有一个紧急警报,我们能怎么做呢?接下来,cpolar就派上永场啦!

4.安装cpolar实现随时随地开发

cpolar 可以将你本地电脑中的服务(如 SSH、Web、数据库)映射到公网。即使你在家里或外出时,也可以通过公网地址连接回本地运行的开发环境。

❤️以下是安装cpolar步骤:

官网在此:https://www.cpolar.com

使用一键脚本安装命令:

sudo curl https://get.cpolar.sh | sh

e464b045413a024674a93ea472511b0f

安装完成后,执行下方命令查看cpolar服务状态:(如图所示即为正常启动)

sudo systemctl status cpolar

aa03713b56d9eef12a4da6b99d2e46ac

Cpolar安装和成功启动服务后,在浏览器上输入虚拟机主机IP加9200端口即:【http://ip:9200】访问Cpolar管理界面,使用Cpolar官网注册的账号登录,登录后即可看到cpolar web 配置界面,接下来在web 界面配置即可:

打开浏览器访问本地9200端口,使用cpolar账户密码登录即可,登录后即可对隧道进行管理。

3af79ad708cc47c5bbea0b63c2c7230d

5.配置公网地址

登录cpolar web UI管理界面后,点击左侧仪表盘的隧道管理——创建隧道:

  • 隧道名称:可自定义,本例使用了:prometheus,注意不要与已有的隧道名称重复

  • 协议:http

  • 本地地址:9090

  • 域名类型:随机域名

  • 地区:选择China Top

    点击创建:

image-20251114153323878

创建成功后,打开左侧在线隧道列表,可以看到刚刚通过创建隧道生成了公网地址,接下来就可以在其他电脑或者移动端设备(异地)上,使用地址访问。

image-20251114153623930

访问成功。

image-20251114153828083

6.保留固定公网地址

使用cpolar为其配置二级子域名,该地址为固定地址,不会随机变化。

1b5b18459db4d0a167e947c02c3e14aa

点击左侧的预留,选择保留二级子域名,地区选择china top,然后设置一个二级子域名名称,我这里演示使用的是prometheus,大家可以自定义。填写备注信息,点击保留。

image-20251114154041459

登录cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道prometheus,点击右侧的编辑

image-20251114154117950

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 域名类型:选择二级子域名
  • Sub Domain:填写保留成功的二级子域名
  • 地区: China Top

点击更新

image-20251114154207469

更新完成后,打开在线隧道列表,此时可以看到随机的公网地址已经发生变化,地址名称也变成了保留和固定的二级子域名名称。

image-20251114154224055

最后,我们使用固定的公网地址在任意设备的浏览器中访问,可以看到成功访问本地部署的prometheus页面,这样一个永久不会变化的二级子域名公网网址即设置好了。

image-20251114154303348

这样,我们就可以随时随地监控,不用担心,在家无法监控设备!

总结

监控的意义,不是制造焦虑,而是带来确定性与安全感。

如果你还在被杂乱无章的告警困扰,不妨从今天开始,用 Prometheus + Alertmanager 打造属于你的智能告警系统——让每一次告警,都值得被唤醒。

感谢您对本篇文章的喜爱,有任何问题欢迎留言交流。cpolar官网-安全的内网穿透工具 | 无需公网ip | 远程访问 | 搭建网站

Share:

发表回复

目录

On Key

推荐文章