首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
华为云
V2EX  ›  Linux

Linux ps 有没有可能有 bug?

  •  
  •   xi2008wang · 30 天前 · 823 次点击

    就是一个脚本的 restart.sh 脚本,stop start 停止和启动都会 ps -C 看进程在不在,可是 1000 台机器里时不时有 1,2 台有问题,进程 start 失败

    诡异的日志

    2018-09-18 08:33:45 check rsvr4 :exist pid[24927]          进程在
    2018-09-18 08:33:45 stop rsvr4[24927] begin                开始停
    2018-09-18 08:33:45 check rsvr4 :exist pid[24927]          还在
    2018-09-18 08:33:46 check rsvr4 :not exist                 *不在
    2018-09-18 08:33:46 stop rsvr4[24927] ok check outtime:1s  记录停成功
    2018-09-18 08:33:46 check rsvr4 :not exist                 *进程不在
    2018-09-18 08:33:46 start rsvr4 begin                      开始启动
    2018-09-18 08:33:46 check rsvr4 :exist pid[24927]          *进程又在
    2018-09-18 08:33:46 start rsvr4[24927] ok check outtime:0s 记录进程启动成功
    

    实际 24927 会在脚本执行完成后真正 stop 到,然后进程就没有了。。。

    关键就在这诡异 ps -C 为什么时不时进程 ps 不到呢,是有 bug 吗?

    1 回复  |  直到 2018-09-18 16:54:24 +08:00
        1
    xi2008wang   30 天前
    失败机器的另一个进程是正常的,同样的 restart 脚本,日志是这样:
    <pre>
    2018-09-18 08:33:45 check rsvr3 :exist pid[24921]
    2018-09-18 08:33:45 stop rsvr3[24921] begin
    2018-09-18 08:33:45 check rsvr3 :exist pid[24921]
    2018-09-18 08:33:46 check rsvr3 :not exist
    2018-09-18 08:33:46 stop rvr3[24921] ok check outtime:1s
    2018-09-18 08:33:46 check rsvr3 :not exist
    2018-09-18 08:33:46 start rsvr3 begin
    2018-09-18 08:33:46 check rsvr3 :exist pid[24934]
    2018-09-18 08:33:46 start rsvr3[24934] ok check outtime:0s
    </pre>
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2993 人在线   最高记录 3762   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.1 · 16ms · UTC 01:11 · PVG 09:11 · LAX 18:11 · JFK 21:11
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1