Я какое-то время назад смотрел в исходники kafkaengine - там на ура могут возникать дубликаты. Данные пишутся в clickhouse, а после этого клиент пробует закомитить оффсет. Пробует он сделать это максимум 3 раза, если мне не изменяет память.
вот именно. есть ли какой-нибудь експ по разрешению таких ситуаций?
Да и не люблю полагаться на одного человека в ключевых решениях.
и поэтому вы решили спросить холиварщиков и тунеядцев из чатика, для которых все что меньше миллиарда строк это "не тема"? =) вам будет сложно растить бизнес не имея человека которому вы доверяете техническую часть. заимейте хотя бы консультанта...