1. 常见故障包括DNS解析失败、SSH/远程连接超时、Web服务端口不可达、磁盘I/O瓶颈与内存耗尽、带宽抖动或被DDoS攻击。
2. 免费节点常见问题源于资源配额、IP段被封、DNS提供商限速、反向解析缺失、控制面板误配置等。
3. 排查要点:网络连通性、DNS记录正确性、端口监听状态、服务日志、系统负载与磁盘使用率。
4. 常用工具:ping、traceroute、dig/nslookup、ss/netstat、tcpdump、top、df -h、journalctl。
5. 恢复策略应分步进行:先恢复连接,再恢复服务,最后优化与加固,保证可回溯的操作日志。
1. 验证记录:使用dig +short yourdomain.com A、dig @8.8.8.8 yourdomain.com SOA,检查A/AAAA/CNAME/TXT与TTL是否正确。
2. 比对生效:检查域名注册商与云解析面板的NS是否一致,确认域名在全球的传播(dig +trace)。
3. 常见误配置:重复CNAME与A冲突、错误的泛解析、SOA序列号未递增导致缓存旧记录。
4. 数据示例:记录TTL短时测试用300s,正式采用3600s;示例:A记录:1.2.3.4 TTL=300。
5. 恢复方法:修正面板记录、强制刷新解析(增加序列号)、联系域名商或ISP清除缓存,如必要更换DNS提供商。
1. 首先确认网络连通:ping 1.2.3.4、traceroute 1.2.3.4(记录丢包率与跃点延迟)。
2. 端口监听检查:在服务器上运行 ss -tuln | grep :22 或 netstat -tunlp 确认SSH服务是否监听。
3. 防火墙规则:检查iptables -L -n 或 ufw status,确认没有误封入站22/80/443端口。
4. 日志排查:查看/var/log/auth.log 或 journalctl -u sshd 获取认证失败或配置错误信息。
5. 恢复技巧:若控制面板可用,重启ssh服务(systemctl restart sshd),若无远程恢复通道,可通过控制台模式或救援系统修复sshd_config。
1. 检查服务状态:systemctl status nginx 或 apache2,确认进程与配置是否加载成功。
2. 端口冲突:ss -ltnp | grep :80 | grep :443,若有占用,定位进程并处理(kill/调整配置)。
3. 证书问题:openssl s_client -connect yourdomain.com:443 -servername yourdomain.com 查看证书链与SNI。
4. 反代/负载均衡:确认上游服务器是否健康,nginx proxy_pass 配置应有健康检查与超时设置。
5. 恢复方法:回滚最近配置修改、临时启用HTTP并排查HTTPS问题、使用自签或备用证书快速恢复服务。
1. 磁盘监测:df -h 查看挂载点使用率,du -sh /var/log/* 定位异常日志膨胀。
2. 内存与交换:free -m、top 查看内存与swap使用,识别OOM杀手或内存泄漏进程。
3. CPU瓶颈:top 或 htop 排序CPU占用,perf或pidstat深入分析高负载原因。
4. I/O等待:iostat -x 1 3 或 dstat 检查磁盘iops与await,排查慢盘导致的服务卡顿。
5. 恢复策略:清理日志与缓存、扩容磁盘或挂载云盘、限制进程内存、启用swap或重启受影响服务。
1. CDN配置错误:确认CNAME指向CDN提供商的域名,CDN缓存策略与回源域名是否正确。
2. 回源不可达:CDN面板通常显示回源健康检查,若回源不可达,先检查源站的防火墙与IP白名单。
3. DDoS表现:高并发连接、带宽耗尽或SYN泛洪,服务器top与ss显示大量半开连接。
4. 应急措施:切换到有过滤能力的公有CDN/云防护、调整ACL、启用速率限制与连接限制策略。
5. 恢复流程:临时屏蔽攻击源IP段、开启验证码或WAF规则、联系上游带宽提供商协同清洗。
1. 案情概述:客户使用免费香港云解析,将www.example.hk CNAME 指向 provider.example.net,但同时存在A记录指向旧IP,导致解析不稳定。
2. 排查过程:dig +trace www.example.hk 显示CNAME链与不同解析结果,TTL=600 时有旧IP返回。
3. 修复操作:在解析面板删除冲突A记录,确保www只用CNAME,递增SOA序列并将TTL调低为300以加速测试。
4. 恢复验证:24小时内通过多个公共DNS节点(8.8.8.8、1.1.1.1)反复dig确认无旧IP返回。
5. 教训与建议:避免混合CNAME与A、对免费节点做流量隔离测试、为关键服务启用多DNS提供商冗余。
下面为典型香港免费VPS示例配置,便于排查时对照资源上限与瓶颈:
| 项目 | 示例值 |
| CPU | 1 vCPU (Intel Xeon) |
| 内存 | 1 GB RAM |
| 磁盘 | 20 GB SSD |
| 公网IP | 203.0.113.45(香港段) |
| 带宽 | 1 Gbps 共享,限速100 Mbps 峰值 |
| 典型端口 | 22,80,443 |
1. 建议:对生产服务使用付费或有SLA的DNS与CDN,免费节点仅做测试或非关键业务。
2. 监控:部署基础监控(PING、HTTP、响应时间、流量、错误率),并设置告警策略。
3. 备份:定期导出DNS配置、配置管理与自动化脚本,确保可快速回滚。
4. 安全:开启WAF、速率限制、严格的防火墙规则及geo-block策略减少被攻击风险。
5. 操作日志与演练:记录每次变更并定期演练故障恢复,提高团队响应速度。