сейчас более детально опишу пример
есть кластер из 2 шардов, на каждом по 2 реплики
на каждой ноде есть таблица “events_shard” (ReplicatedMergeTree) и “events” (Distributed)
В кафке есть топик с названием “events”.
Из этого топика нужно записывать данные в БД.
для этого я создал табличку “events_kafka” (Kafka)
на него хочу повесить матвью
Хочу понять нужно ли это матвью делать на каждой ноде и куда лучше писать, в Distributed таблицу, либо в ReplicatedMergeTree таблицу.
Боюсь задублировать либо недозаписать данные.
а в этом топике в перемешку лежать данные для обоих шардов?
Я бы сделал 4 MV которые пишут каждый в свою MV таблицу, вроде кафка такое позволяет с своими группами и тд