У одних знакомых людей случился инцидент на проде, потеряли деньги из-за healthcheck-ов. Казалось бы, а что же могло пойти не так?
Фаст-форвард в Кубернетес (потому что сейчас почти все ссылки по теме чеков ведет к кубам, скорее всего это было придумано раньше, но такова жизнь).
Так вот, там есть 2 вида: Liveness и Readiness.
1й отвечает на вопрос: сервис жив?
2й отвечает на вопрос: а готов ли?
И вот у людей не было ответа на 2й вопрос, что привело к неправильной обработке запросов и еще неким вещам (детали не важны).
Статья от чеках (с гифками)
https://cloud.google.com/blog/products/gcp/kubernetes-best-practices-setting-up-health-checks-with-readiness-and-liveness-probesНу и конфиги в кубах (для примеров)
https://kubernetes.io/docs/tasks/configure-pod-container/configure-liveness-readiness-probes/PS: люди жили не на кубернетесе, что-то свое было.