почти все эти статьи читал, да
но пока не нашел инструмента с возможностью из коробки планировать ~5-10 млн. задач
есть идея только такая: хранить задачи в postgresql (paritition + sharding при необходимости)
rabitmq / kafka - для доставки задач на выполнение
И поверх всего этого, придется сделать самим управление задачами:
- отменить задачу (еще не ушла на выполнение, в очереди ожидает выполнение, уже у воркера на выполнении)
- обновить задачу (пришла более актуальная информацию, все тоже самое что и для отмены)
т.е. проблема больше не в нагрузке, задач не так много в ед. времени
а в удобном управлении выполнением, т.к. одна задача затрагивает много сервисов, иногда платных
и хочется гибко управлять выполнением (не делать лишние вызовы)
наткнулся как-то на
http://activemq.apache.org/но еще не успел посмотреть, это вроде чуть больше навороченный rabbitmq