游戏延迟优化实测：自建中继 vs 商业加速器 • Liu Yang's Blog

本文记录一次系统性的游戏延迟测试，对比通过中继服务器加速与商业加速器在不同地区的实际表现，并分析不同网络方案对游戏延迟和稳定性的影响。

测试环境

英雄联盟台服参考：32～33ms

端内延迟记录 Ping，Tcping 往往更有参照性，二者在稳定线路下相差不大。

地区	方案（端内延迟）	CS2	Apex	线路类型	隧道方式	备注
HK	深港专线 → HK 落地（28ms）	28～29ms	29～34ms	专线	TCP 封装	非常稳定，大带宽
HK	高端 HK 直连（30ms）	30～31ms	31～36ms	高端	TCP 封装	极稳，零波动，大带宽
HK	深港专线 → HK 落地（33ms）	33～34ms	55～60ms	专线	原生 UDP	稳定，游戏小包
HK	大厂优化线路 → HK 落地（29ms）	32～35ms	40～55ms	优化	TCP 封装	偶有丢包，不稳
HK	优化线路 HK（37ms）	38～39ms	43～48ms	优化	TCP 封装	晚高峰 66ms，原生 UDP 差，需搭配落地
TYO	沪日专线 → JP 落地（37ms）	37～38ms	40～50ms	专线	原生 UDP	非常稳定，游戏小包
TYO	高端 JP 直连（33～35ms）	34～36ms	41～53ms	高端	TCP 封装	非常稳定，大带宽，体验最佳
TYO	优化 JP（35ms）	36～38ms	38～45ms	优化	TCP 封装	小幅波动，需搭配落地
SEA	高端 JP → JP 骨干 → SEA（118ms）	125～126ms	128～131ms	高端+专线	两层 TCP 封装	链式多跳，非常稳定，大带宽
SEA	沪日专线 → JP 骨干 → SEA（119ms）	127ms	129～136ms	专线	原生 UDP	稳定，游戏小包
LAX	高端 LAX 直连（129ms）	134ms	163～168ms	高端	TCP 封装	非常稳定，不适合 FPS
FRA	北京骨干 → DE（27+116ms）	155ms（荷兰节点）	163～170ms	高端	TCP 封装	非常稳定
FRA	北京骨干 → DE → DE 落地（144ms）	153～154ms	154～161ms	高端	TCP 封装	两层转发，稳定

香港：专线延迟和高端直连接近，优化线路（大厂前置）延迟可接受但偶有波动。线路类型优先级：专线 ≈ 高端 > 优化。

日本：沪日专线受众少但延迟出色；高端直连国际互联好，是综合体验最稳的方案。

美国：亚太 → 美西西雅图采用日本中转可将延迟压到 117～119ms 范围，与商业加速器基本持平。路径质量取决于日本到西雅图段走的骨干网（RETN、GSL、SIX），不同骨干延迟差 3～5ms。

欧洲：自建中继方案延迟比商业加速器约高 10～15ms，主要瓶颈在国内出口段。走联通 9929 骨干到德国是目前延迟最优的路径，约 144ms。FPS 游戏场景对该差距感知明显，休闲游戏可以接受。

教育网：若出口先绕到北京汇聚，优化线路的意义会打折。接入 HKIX 的香港主机直连通常延迟不差，IPv6 路径更为直接。

游戏流量本质是 UDP，但部分中继场景下会将其封装进 TCP 隧道（UDP over TCP，简称 UoT）传输。以下分析其固有影响。

跨国链路上，运营商有时会对 UDP 流量做 QoS 限速甚至丢弃，TLS 流量则很少受影响。将游戏 UDP 包封装成看起来像普通 HTTPS 的 TCP 流量，可以规避这一问题，代价是引入了 TCP 协议本身的特性。

队头阻塞（Head-of-Line Blocking） 是最核心的问题：

额外开销：每个原始 UDP 包都要套上多层协议封装头，包体积增大，小包（如游戏心跳包）的封装开销占比尤其高。

处理延迟：TCP 握手、拥塞控制算法、封包解包的 CPU 开销，会引入额外的毫秒级延迟。

在线路质量好（稳定、不丢包）的条件下，UoT 对延迟的影响极小：

结论：线路存在 QoS 风险时优先 TCP 封装；专线且链路干净时可以用原生 UDP。不必过度纠结，协议封装层面的优化远不如换条更好的线路来得直接。

多跳链式转发场景：由于跨国 UDP 质量不稳定，这类方案通常全程使用 TCP 封装。不同封装方案（如 WebSocket + TLS、纯 TLS 等）之间的延迟差异极小，基本可以忽略，速度上略有差异。
专线直连场景：隧道方式的选择影响不大，主要取决于线路本身是否存在 QoS。有原生 UDP 入口时略优，不必为此额外投入。
总结：隧道方式对延迟的影响在毫秒量级，线路质量和节点位置才是游戏体验的决定因素。优化顺序应该是：线路 → 节点位置 → 封装方式。

观察规律：香港、日本区域，Ping 累加基本等于游戏内延迟；但欧美区域，游戏延迟比 Ping 往往高出 5～10ms。

可能的原因：欧美区域通常需要 2 跳以上的中继，每一跳的封包处理、路由判断都会累积少量延迟。亚太区由于物理距离近，单跳或两跳即可到达，这部分损耗不明显。

几个可能的优化方向：