писал на го консьюмер для RabbitMQ чтобы бачами скидывать сообщения в клик. (на тот момент в кх движка для реббита еще не было) ничего сложного, работает на пределе производительности реббита. Уверен для пульсара с достаточным опытом его эксплуатации - не будет никаких проблем написать подобную прослойку
Спасибо! Идея с самописным консьюмером у меня как запасной вариант пока что
писал на го консьюмер для RabbitMQ чтобы бачами скидывать сообщения в клик. (на тот момент в кх движка для реббита еще не было) ничего сложного, работает на пределе производительности реббита. Уверен для пульсара с достаточным опытом его эксплуатации - не будет никаких проблем написать подобную прослойку
А вы в один шард вставляли или в несколько? Если в несколько, то где логику разделения реализовывали? Или вы в distributed льёте?
А вы в один шард вставляли или в несколько? Если в несколько, то где логику разделения реализовывали? Или вы в distributed льёте?
лил в сторону одного хоста, просто в памяти набирал батч до размера prefetch count и скидывал в клик по таймеру или же по достижению длины prefetch count. если бы была потребность шардировать скорее всего я бы сначала расшардировал в отделные очереди в реббите (тоже самописным консьюмером, или на крайняк локтсешом) и лил бы каджую очередь в свою шарду
лил в сторону одного хоста, просто в памяти набирал батч до размера prefetch count и скидывал в клик по таймеру или же по достижению длины prefetch count. если бы была потребность шардировать скорее всего я бы сначала расшардировал в отделные очереди в реббите (тоже самописным консьюмером, или на крайняк локтсешом) и лил бы каджую очередь в свою шарду
спасибо. расшардировать на уровне очереди звучит весьма логично
Всем привет, вопрос по мат. представлениям: я правильно понимаю что если создать мат. представление и его использовать в запросе другого мат. представления то это работать не будет?
Интересно какой у вас будет с ним опыт, мне в ближайшее время предстоит подружить КХ с пульсаром и немного смущает отсутствие хоть каких-то отзывов об этом - или все хорошо, или так почти никто не делал. Что меня смущает - в конфигурации есть batch size, но нет никакого таймаута, и как бы он не начал писать один батч за другим при интенсивном потоке данных
Да вот тоже кажется что проще не коммитить в код КХ, а написать обмен на функциях пульсара или на airflow