1.
准备与安全检查
关闭电源并断开UPS与市电输入,确保无带电作业风险。
记录当前机架位置与IP地址、MAC地址以便复位。
准备防静电手环、标签、螺丝盒与适配工具套件。
备份重要虚拟机与配置(快照/备份到异地)。
在维护单上填写维护时间、负责人和回滚计划。
检查机房环境:温湿度、空调状态与机柜负载。
2.
物理拆机顺序与注意事项
先在OS上执行优雅关机:systemctl poweroff 或 shutdown -h now。
断开网络、KVM/IPMI远程会话后拔除外部线缆并标记。
按顺序拆卸上盖、风扇模块、前置托架与热插拔盘位。
拆卸CPU散热器前确认导热膏老化需更换,避免弯曲针脚。
拆卸内存时记下插槽配置,单条更换要保证ECC/规格一致。
更换硬盘时优先做RAID rebuild并核对序列号与SMART状态。
3.
常见部件检测与更换流程
CPU与散热器:检查浸氧、风扇转速与温度曲线,必要时换硅脂重装。
内存:使用memtest86做至少2轮完整扫描,发现错误立即替换。
硬盘:smartctl -a /dev/sdX查看Reallocated_Sector_Ct与Pending_Sector。
电源:交换冗余PSU逐个测试,并检查输出电压稳定性。
带宽/网卡:检验端口速率、双工与丢包,iperf3做吞吐验证。
4.
网络配置、域名与CDN接入示例
示例:香港机房BGP独立1Gbps出口,采用双IP/双机房冗余方案。
域名解析:主DNS设置A记录指向公网IP,备份CNAME接入CDN。
CDN与DDoS:接入CDN(如Cloudflare/阿里云CDN)做七层缓存与WAF保护。
路由策略:本地BGP与ISP对接,设置前缀长度/社区以防路由劫持。
流量监控:NetFlow/sFlow与ELK展示实时带宽与异常峰值。
下面为一个真实配置样例(表格展示):
| 项 | 配置 |
| 机型 | Dell R340 |
| CPU | Intel Xeon E-2236 6C 3.4GHz |
| 内存 | 32GB DDR4 ECC |
| 硬盘 | 2x1TB SATA RAID1 |
| 带宽 | BGP 1Gbps 专线 |
5.
DDoS防御与攻防演练
部署多层防护:边缘CDN+清洗中心+本地ACL与速率限制。
阈值设置:测得正常峰值为300Mbps,设置告警阈值为400Mbps。
实战演练:使用流量回放或受控攻击测试清洗能力,记录丢包率与恢复时间。
攻击日志分析:结合IDS/防火墙,提取源IP、SYN/UDP分布与攻击向量。
应急流程:触发黑洞/流量重定向前需执行业务白名单与沟通通告。
6.
复装、上线验证与维护记录
按标签复位线缆、插回硬盘并确认RAID健康,重启进入BIOS/IPMI检查。
固件与驱动:更新至厂商推荐的稳定版本并记录版本号。
上线验证:跑压力测试(stress-ng, fio)并对比基线数据。
记录文档化:维护单、变更记录、性能曲线以及问题决策。
案例总结:某香港客户更换风扇并重建RAID后,IOPS由3k提升到8k,年中成功抵御一次200Gbps反射攻击。
来源:企业机房维护必备香港服务器电脑拆机教程完整版