Всем привет! У меня такой пайплайн: Есть таблица MergeTree, в которую сыпятся данные по 5млн товаров несколько раз в день. Эта таблица не меняется, только дополняется. Для того, чтобы cэкономить место, данные по товарам (названия, категории, поставщики и пр.), я сохраняю в отдельную таблицу с движком Join. Это позволяет и экономить место и делать разные аггрегации. Однако, я хотел бы в таблице Join менять только изменяющиеся данные, а не перезаливать 5млн товаров несколько раз в день (например, обновить только 100тыс товаров). Мне продолжать сидеть на Join или лучше смотреть в другие движки, например ReplacingMergeTree (которые удаляет дубликаты, но не сразу)
кстати откуда данные берутся? Может просто словарь все сам сделает? И заливать вообще не надо