Добрый вечер. Читаем данные из Кафки , пишем в *mergeTree таблицу . Как результат очень много активных кусков после инсерта, которые со временем (несколько минут) исчезают. Правильным ли подходом будет читать в buffer таблицу ? Смущает ее особенность, когда данные могут потеряться.
Тоже прочитал про буфер-движок и подумал, что он на уровне кх реализует то, что у нас сейчас наша самописеая приложенька делает: читает кафку, раз в 10 сек скидывает батч по 5-20к записей в кх. Но почитав подробней про buffer, понял, что наше решение огонь))
Ну, а вообще 5-10 тыщ партов это овер дохуя