Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
azraelrabbit
V2EX  ›  云计算

阿里云国际-马尼拉机房-公网出口某个连接/状态阈值异常偏低-大家注意踩坑

  •  
  •   azraelrabbit · May 25 · 1807 views

    听说这里有各大云厂商的客服,那就吐槽一下.

    事情的起因是 23 日凌晨有同事反应, 从阿里云国际马尼拉机房访问 GCLB 的 https api 经常出现请求失败.

    后来查了一下,网路延迟,traceroute 都正常.

    然后搞了并发测试脚本, 120 并发, 3000 次请求, 在开始的 3 秒钟一切正常,之后就开始连续的 tls handshake timeout .

    这是 gclb 出问题了,不能吧.

    然后在 AWS 新加坡机房 新建机器, 跑同一个测试脚本,连续 10 轮,未复现.

    然后在 LightNode 马尼拉机房 新建机器, 跑同一个测试脚本,连续 10 轮,未复现.

    开始是怀疑 GCLB 做了策略调整, 后来在 腾讯云新加坡机房新建节点,部署测试 https api, 结果挺有意思:

    阿里云国际马尼拉机房=> 腾讯云新加坡 == tls handshake timeout

    AWS 新加坡机房 => 腾讯云新加坡 == 一切正常

    LightNode 马尼拉机房=> 腾讯云新加坡 == 一切正常

    对比样本太少? 好的,测一下苹果的 hotspot 测试页: https://captive.apple.com/hotspot-detect.html 结果一样:

    阿里云国际马尼拉机房=> 苹果的 hotspot == tls handshake timeout

    AWS 新加坡机房 => 苹果的 hotspot == 一切正常

    LightNode 马尼拉机房=> 苹果的 hotspot == 一切正常

    有阿里的客服或工程师,麻烦帮忙排查一下, 或者同学们要注意避坑了.

    6 replies    2026-05-26 12:59:04 +08:00
    dode
        1
    dode  
       May 25
    好像阿里被大量薅羊毛,线路不稳定?
    stormtrooperx5
        2
    stormtrooperx5  
       May 25
    这种问题直接发工单吧
    Kinnice
        3
    Kinnice  
       May 25 via Android
    @dode 同地域访问出问题基本上不是线路本身导致的
    azraelrabbit
        4
    azraelrabbit  
    OP
       May 25
    @stormtrooperx5 发工单了,目前还是在调查中
    azraelrabbit
        5
    azraelrabbit  
    OP
       May 26
    最新进展, 经过 2 天的排查, 阿里售后在在阿里国际马尼拉机房复现问题. 但归结于公网抖动丢包.

    已更换运营商,不再使用阿里云国际马尼拉机房,问题彻底解决.
    azraelrabbit
        6
    azraelrabbit  
    OP
       May 26
    @azraelrabbit 经实测, 阿里云马尼拉机房的轻量服务器目前已恢复正常,但同时间段 ecs 问题依旧,没精力没时间再耗下去了.
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2936 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 50ms · UTC 15:15 · PVG 23:15 · LAX 08:15 · JFK 11:15
    ♥ Do have faith in what you're doing.