Vladyslav Sakun
Да я понимаю что такое словарь.
Думал что в зависимости от сорса словаря меняется занимается место в памяти.
И да мне нужно сделать JOIN по двум очень большим таблицам, одна из них более миллиарда записей имеет, а вторая как я уже и говорил 200-300 миллионов
место в памяти не от источника зависит а от layout
ssd_cache
оптимальный вариант "для очень больших словарей"
https://clickhouse.tech/docs/en/sql-reference/dictionaries/external-dictionaries/external-dicts-dict-layout/#ssd-cacheно слово SSD означает что работать будет более или менее только на нормальном железе
вообще наличие двух больших таблиц, говорит о том, что что-то спроектировано не так
почему данные из меньшей таблицы который такие большие?
что именно там за данные? почему у них такая кардинальность?
почему нельзя обогатить основную таблицу перед вставкой?
или почему нельзя в момент когда данные появляются в "малой" таблице
обогащать данные из основной таблицы вставляя через INSERT INTO ... SELECT в третью таблицу?
вместо JOIN
я бы конечно посоветовал dictGet ... оно более старое и надежное...