Y
заменяет ли Buffer в ClickHouse использование Kafka брокера для пакетного добавления данных?
1. Мало серверов (до 100), не страшно терять данные, батчи уже собраны в самом приложении — вставляйте прямо в Buffer
2. Как (1), но серверов больше 100 — то же самое, с kittenhouse --reverse
3. Данные терять страшно (но не настолько страшно, чтобы терять данные из буферной таблицы при некорректном завершении ClickHouse), но дубли не страшны — kittenhouse, но пишем данные в режиме persistent=1 (данные складываются на локальный диск каждой машины)
4. Уже везде используется Kafka, умеете её правильно настраивать, и не боитесь багов с ENGINE=Kafka в ClickHouse — используйте Kafka
5. Данные очень важны и дубли тоже страшны, но не жалко потратить кучу времени на правильную настройку Kafka и написания своих cron-джобов для выгребания из Kafka и вставки из неё в ClickHouse — тоже вариант, но трудоемкий. Учитывайте, что Kafka имеет много подводных камней (есть хороший доклад про это от Дениса Карасика: https://www.highload.ru/moscow/2019/abstracts/5962)