KMpAn8Obw1QhPoEP
V2EX  ›  问与答

如何排查 AWS ELB 504?

  •  
  •   KMpAn8Obw1QhPoEP · Apr 15, 2024 · 1267 views
    This topic created in 759 days ago, the information mentioned may be changed or developed.

    某个请求失败,查 S3 里的 Log 发现 ELB 响应码 504 ,后端响应码 0 ,并且在 Tomcat 的 AccessLog 里找不到该请求,说明请求压根没转发到后端上,如何排查 504 的原因?

    9 replies    2024-04-16 00:59:32 +08:00
    stardustree
        1
    stardustree  
       Apr 15, 2024
    提工单
    KMpAn8Obw1QhPoEP
        2
    KMpAn8Obw1QhPoEP  
    OP
       Apr 15, 2024 via Android
    @stardustree 啊 还以为是我们的问题…
    stardustree
        3
    stardustree  
       Apr 15, 2024   ❤️ 1
    @enchilada2020 不一定。另外即使是你们的问题,帮助客户定位问题也是云厂商提供的服务之一(最起码把问题掰扯干净,到底是哪个环节出的问题)。
    whileFalse
        4
    whileFalse  
       Apr 15, 2024 via Android
    先看看 alb 的监控有没有被访问的计数
    whileFalse
        5
    whileFalse  
       Apr 15, 2024 via Android
    再看看业务机器安全组的配置
    Alliot
        6
    Alliot  
       Apr 15, 2024
    ELB 是 Target Group 直接到 tomcat ? 请求失败的话,客户端是直接请求 ELB ?
    KMpAn8Obw1QhPoEP
        7
    KMpAn8Obw1QhPoEP  
    OP
       Apr 15, 2024 via Android
    @Alliot
    1. 是 classic 的 ELB 没有 target group
    2. ELB 之后就是 tomcat 了 但访问日志里没有记录 能查到的全部 200 考虑到从 ELB 到后端可能存在一定延迟 ELB Connection Idle Timeout 是 300s 从 ELB 日志的时间戳开始 5 分钟内所有日志都查遍了 依然没有
    3. 该现象至少去年 11 月份就有 不过不多 从今年 2 月开始涨了 10 倍 大概能有 6K 左右
    KMpAn8Obw1QhPoEP
        8
    KMpAn8Obw1QhPoEP  
    OP
       Apr 15, 2024 via Android
    @whileFalse 应该不是安全组问题…?相同请求连续请求数十次 只有一次 504 其他都正常返回 200 了 本来怀疑是后端阻塞处理不了 但看日志请求压根就没来…
    whileFalse
        9
    whileFalse  
       Apr 16, 2024 via Android
    @enchilada2020 这个年代为什么要用 clb 。后端压力如何,尝试多加几台后端能不能改善?另外就是开 ticket
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1087 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 43ms · UTC 18:30 · PVG 02:30 · LAX 11:30 · JFK 14:30
    ♥ Do have faith in what you're doing.