精华:1)先把问题拆成物理层、路由层、传输层、应用层;2)用ping/traceroute/MTR 从多点对比,快速定位“哪里断”;3)若怀疑跨境策略或被拦截,立刻查BGP与公有Looking Glass并抓包证明。
作为网络运维与跨境链路优化实战者,我在文中将用最直接、最具操作性的流程带你把问题从抽象变成可执行的检测清单。整个过程强调证据链与可复现步骤,符合谷歌的EEAT要求:经验(实际命令与案例)、专业性(分析逻辑)、权威性(引用常用工具)、可信度(抓包与BGP证据)。
第一步:界定症状。先确认是全网不可达还是部分服务异常。用最基础的ping(ICMP)与telnet IP port(或curl)验证TCP三次握手是否成功。若ping通但服务不可用,问题可能在应用或防火墙;若ping不通,问题很可能在路由或链路上。
第二步:从本地到出口的快速排查。检查本地网络与DNS,命令示例(均请在终端执行并保存输出以便上报): ping traceroute MTR(或Windows的tracert)等。若本地能到达香港出口但不能到内地IP,请记录第一跳与异步跳点IP并截图。
第三步:跨点对比。真正定位跨境问题必须从多点对比。使用公有探针:RIPE Atlas、Looking Glass(ISP和IX的)和第三方工具(如ping.pe、bgp.he.net)从香港节点、内地节点与第三国节点同时做
第四步:分析 第五步:检查BGPbgp.he.net、RouteViews、RIPE RIS)检索目标前缀的公告情况:是否有多条路径、是否被黑洞(MAX-PREPEND、NO_EXPORT)、是否有社区属性指向过滤。若前缀被withdraw或走向异常,问题定位到路由层。 第六步:判断是否为政策或审查导致(例如GFW影响)。若在traceroute中出现TTL被截断、TCP RST/ICMP unreachable从某一跳开始,且多个AS/多点均表现相同,极有可能为跨境策略或中间节点DPI拦截。需要抓取TCP三次握手与RST包(使用tcpdump或Wireshark),保存pcap作为证据。 第七步:抓包与深度分析。抓包时至少抓两端(香港出口与目标内地服务器旁路由)并记录时间、IP、端口、TCP flags。关键看点:
- 是否收到来自中间设备的TCP RST或ICMP unreachable;
- 是否有SYN发送但无SYN/ACK(可能丢在传输中);
- 是否存在MTU/分包导致的Path MTU问题(ICMP Fragmentation Needed)。 第八步:特殊链路要点——海缆与IX。跨境流量常走特定海缆(例如APG、AAE-1等)和交换节点(比如HKIX)。当多个ASN的流量在同一海缆/IX节点出现问题时,应关注海缆维护、光缆断裂或对等端口故障。查阅运营商公告与海缆维护通知是必要的。 第九步:MTU与TCP调优。有时看似“不可达”实际上是MTU不一致导致TLS握手或大包被丢弃。使用ping带大小和Do-Not-Fragment位逐步定位最大发送包长,或用tracepath检查PMTU。对于HTTPS失败的情况同时尝试HTTP/80或直接TCP端口测试,以确认是否TLS层问题。 第十步:形成证据与上报清单。联络ISP或对端网管时,提供:1)测点时间与时区;2)本地与远端的 第十一步:如果本地无法解决的快速应急措施:
- 暂时切换到备用出口或备份ISP;
- 使用海外中转(例如香港到第三国再入内地)或基于云的加速(CDN/专线);
- 启用隧道或VPN作为临时通道,同时保留抓包证据协助后续定位。 第十二步:长期解决建议与避免复发:建立多点监控(RIPE Atlas probes / 自建探针)、配置BGP备份与更优的社区策略、与关键互联方签订SLA、并与海缆/IX运营方建立联系渠道。对业务敏感的前缀建议采用Anycast或多Region部署。 结语:定位香港内地服务器访问失败的关键在于“分层检测”和“多点对比”——不要只看单一测点。实战中,tracerouteBGP、ping与pcap协助逐条分析并生成上报模板,帮助你快速恢复业务。 作者说明:本人有超过10年跨境网络与CDN运维经验,长期处理ISPBGP故障与链路优化,熟悉抓包与DPI特征分析。若需手把手诊断,请附上原始输出文件(traceroute/ping/pcap/BGP dump)。