достаточно мониторить паттерны типа резко стало меньше
а что такое "резко меньше/больше" ? может это просто пользователи пришли и это ок. вы пробовали? тот ещё гемор) и пока в лимит не упёрлись , по сути, похрену
а что такое "резко меньше/больше" ? может это просто пользователи пришли и это ок. вы пробовали? тот ещё гемор) и пока в лимит не упёрлись , по сути, похрену
Поэтому и говорю - у cadvisor есть метрики лимитов, также есть container_memory_failcnt. Используя суммарную метрику, явно флапать будет меньше (хотя есть шанс пропустить событие, что в целом не критично)