是这样的,正常情况下,队列在运行中如果出错,会有重试的逻辑,如果重试 3 次,则标记这份数据,并跳出,再去接收其他任务。
可是如果是遇到了致命性错误,则队列会挂掉,队列的进程也会被 kill 掉。 那问题来了,这个时候还有队列监控,重新拉起队列进程的必要吗?
为什么我觉得既然是遇到了严重性错误导致了进程都 kill 掉了,完全没必要再拉起呢,我感觉这个时候难道不是让程序员来排查错误吗,难道还要继续错下去?
1
oovveeaarr 2018-11-06 14:50:03 +08:00
致命性错误是啥,列队和处理的业务本来就要分离呀。
列队服务是磊对服务,业务是业务,业务致命错误了,导致列队断了不得行啊。 |
2
wei745359223 2018-11-06 14:54:17 +08:00
supervisord 了解一下
http://supervisord.org/ |