异常类型 | 典型表现 |
---|---|
网络连接异常 | 无法通过IP/域名访问服务、Ping不通、SSL证书报错、端口响应超时 |
服务进程异常 | 特定服务(如Web/FTP)无响应、进程自动退出、启动失败 |
系统资源耗尽 | CPU持续100%、内存溢出、磁盘空间不足、负载均衡失效 |
配置错误 | 环境变量未设置、权限配置错误、防火墙规则冲突、SELinux策略拦截 |
存储故障 | 数据读写失败、磁盘挂载异常、快照恢复失败 |
# 基础网络诊断 ping <服务器IP> -c 4 # 测试基础连通性 telnet <IP> <端口> # 验证端口开放状态 traceroute <域名> # 定位路径中断节点 # 高级网络检测 nc -zv <IP> <端口> # 精准端口扫描 ss -tuln # 查看监听端口状态 iptables -L -n # 检查防火墙规则
# 实时资源监控 top -bn1 | head # CPU/内存使用率 df -h # 磁盘空间 free -m # 内存详情 vmstat 1 5 # 系统负载 # 日志查看优先级 tail -f /var/log/syslog # 系统级日志 journalctl -xe # systemd日志 less /var/log/nginx/error # 服务专项日志
操作指令 | 作用说明 |
---|---|
systemctl status 服务名 | 查看服务运行状态 |
ps aux | grep 进程名 |
netstat -tulnp | 检查端口占用情况 |
curl ifconfig.me | 验证外网IP地址 |
可能原因 | 解决措施 |
---|---|
安全组规则未开放22端口 | 在云控制台添加入站规则(优先限制IP) |
SSH服务未启动 | systemctl restart sshd |
防火墙拦截 | iptables -A INPUT -p tcp --dport 22 -j ACCEPT |
# 排查步骤 1. 查看Nginx/Apache错误日志:tail -f /var/log/nginx/error.log 2. 检查PHP-FPM状态:systemctl status php-fpm 3. 验证文件权限:chown -R www-data:www-data /var/www 4. 测试PHP脚本:echo "<?php phpinfo(); ?>" > test.php
监控体系搭建
自动化运维
/etc/rc.local
)tar + crontab
)安全防护
yum update
)A1:
memwatcher
等工具实时监控APP内存Android:maxAllocatableMemory
配置内存上限-XX:+PrintGCDetails
分析垃圾回收情况A2:
数据采集阶段
perf
采集CPU热点iostat
分析磁盘I/O等待strace
跟踪系统调用耗时性能分析方法
perf record -g && perf script | stackcollapse-perf.pl | flamegraph.pl > kernel.svg
-Xprof
生成CPU采样报告优化方向决策