node_load1/5/15
指标,设置时间间隔与图表类型,通过标签筛选目标服务器,最后保存仪表盘实时查看负载趋势。
配置Grafana监控服务器平均负载
在运维管理中,实时监控服务器的平均负载(Load Average)是保障服务稳定性的重要环节,Grafana作为一款开源的可视化工具,结合Prometheus等数据源,能直观展示服务器负载趋势,以下是详细配置步骤:
安装Node Exporter
Node Exporter用于采集服务器指标(包括负载数据),在目标服务器执行以下命令安装:
wget https://github.com/prometheus/node_exporter/releases/download/v1.3.1/node_exporter-1.3.1.linux-amd64.tar.gz tar xvfz node_exporter-*.tar.gz cd node_exporter-* ./node_exporter &
systemd
用户可通过服务管理(示例参考官方文档)。
配置Prometheus抓取数据
修改Prometheus的配置文件prometheus.yml
,添加Node Exporter的监控目标:
scrape_configs: - job_name: 'node' static_configs: - targets: ['服务器IP:9100']
重启Prometheus服务使配置生效。
http://localhost:9090
)。导入预置仪表盘(推荐)
Grafana社区提供了成熟的仪表盘模板,例如ID为1860的“Node Exporter Full”仪表盘,操作步骤:
1860
,选择数据源为Prometheus,点击Load。手动创建自定义面板
若需针对性监控,可手动配置:
node_load1 # 1分钟平均负载 node_load5 # 5分钟平均负载 node_load15 # 15分钟平均负载
设置负载阈值告警
node_load5 > CPU核心数×0.7
时发送告警(CPU核心数可通过count(node_cpu_seconds_total{mode="idle"})
获取)。数据可视化优化
引用说明