Size: a a a

ClickHouse не тормозит

2020 August 24

DC

Denny Crane (I don't... in ClickHouse не тормозит
Artem
Да, я читал уже. Но там доказано, что он on demand и не надо его трогать.
что значит on demand, не надо трогать если у вас памяти 16+
зуб даю через месяц таблицы дорастут до какой-то величины и у вас будут OOM прям на первом же запросе из-за mark_cache
источник

A

Alex in ClickHouse не тормозит
Виталий
А среди 20.Х версий есть стабильные?
20.6.3.28 полет нормальный
источник

A

Artem in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
что значит on demand, не надо трогать если у вас памяти 16+
зуб даю через месяц таблицы дорастут до какой-то величины и у вас будут OOM прям на первом же запросе из-за mark_cache
Ок, буду тюнить.
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Alex
внешние словари пробовал, не хочется mysql сильно напрягать и скорее может не вытянуть потом : на 1к в MergeThree +-50 записей получается где-то измененных, все таки думаете лучше MySQL выбрать?
зачем вам вообще КХ ? если у вас 1к
источник

A

Alex in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
зачем вам вообще КХ ? если у вас 1к
на 1к - 50 изменений, т.е. вставок, а данных гораздо больше
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Denis Dorozhkin
Скорее всего я не до конца знал как оно работало. Внутренний запрос раньше выполнялся на инициаторе, а сейчас может быть отправлен на любую реплику, почему в таком случае prefer_localhost_replica=1 не помогает?

Это все нужно для того, чтобы запустить ежедневную агрегацию данных на шардах и превратить статистику из сырой в дедуплицированные агрегаты по часам.

А фильтрация по конкретному хосту/шарду нужна чтобы равномерно писать эти агрегаты на имеющиеся шарды (получается одинаковые части сырых данных лежат там же где и те же самые части сагрегированных)

Зачем так сделано я точно сказать не могу.

Основной мой вопрос - как сделать так, чтобы подзапрос к ditributed таблице в итоге передавался на ту же реплику, что и инициатор?
я читаю вот это третий раз уже, такое ощущение что вы пишете из параллельной вселенной и у вас какой-то другой КХ, либо у меня шизофрения. Короче сдаюсь -- я вообще ничего не понимаю.
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Alex
на 1к - 50 изменений, т.е. вставок, а данных гораздо больше
ну ок, а дубликаты они сильно мешают? Может иногда (раз в неделю) делать optmize final ?
источник

A

Alex in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
ну ок, а дубликаты они сильно мешают? Может иногда (раз в неделю) делать optmize final ?
не мешают, как вариант да, спасибо))
источник

A

Alexander in ClickHouse не тормозит
Сходу не получилось. Какие-то крякозябры выдаёт, как будто без декомпрессии читает. А какой формат нужно указывать?

select * from s3('http://../file.csv.gz', 'key', 'secret', 'TSV', 'col1 String, col2 String') limit 5
источник

DT

Dmitry Titov in ClickHouse не тормозит
Alexander
Сходу не получилось. Какие-то крякозябры выдаёт, как будто без декомпрессии читает. А какой формат нужно указывать?

select * from s3('http://../file.csv.gz', 'key', 'secret', 'TSV', 'col1 String, col2 String') limit 5
какая версия кх
источник

DT

Dmitry Titov in ClickHouse не тормозит
попробуй в конец дописать ,'gzip'
источник

A

Alexander in ClickHouse не тормозит
источник

A

Alexander in ClickHouse не тормозит
Dmitry Titov
попробуй в конец дописать ,'gzip'
Последним аргументом?
источник

DT

Dmitry Titov in ClickHouse не тормозит
Alexander
Последним аргументом?
да
источник

A

Alexander in ClickHouse не тормозит
Супер, отработало. Спасибо!
источник

AK

Andrii Kakoichenko in ClickHouse не тормозит
Добрый вечер
Я правильно понимаю, что если создать таблицу c engine ReplacingMergeTree, и поверх нее аггрегирующий materialized view, то при вставке строки с уже имеющимся ключом, старая строка удалится когда-то, но materialized view станет давать новые корректные аггрегаты с учётом новой строки мгновенно?
источник

И

Иван in ClickHouse не тормозит
Andrii Kakoichenko
Добрый вечер
Я правильно понимаю, что если создать таблицу c engine ReplacingMergeTree, и поверх нее аггрегирующий materialized view, то при вставке строки с уже имеющимся ключом, старая строка удалится когда-то, но materialized view станет давать новые корректные аггрегаты с учётом новой строки мгновенно?
Materialized view это триггер на инсерт который хранит данные в отдельной таблице со своим движком
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Andrii Kakoichenko
Добрый вечер
Я правильно понимаю, что если создать таблицу c engine ReplacingMergeTree, и поверх нее аггрегирующий materialized view, то при вставке строки с уже имеющимся ключом, старая строка удалится когда-то, но materialized view станет давать новые корректные аггрегаты с учётом новой строки мгновенно?
нет не  будет, и в общем-то никакого хака для решения проблемы "моментальных апдейтов" нету. Чудес не бывает.
источник

D

Dj in ClickHouse не тормозит
https://clickhouse.tech/docs/en/sql-reference/statements/alter/partition/#alter_drop-partition

а это нормально что drop-partition папки не удаляет? (самодельный ТТЛ огорчает тоже)
"detach + drop detached"  - норм

КХ 20.3
источник

DK

Danil Kuznetsov in ClickHouse не тормозит
Привет всем.
Согласно документации, кликхаус умеет хэшировать данные по алгоритмам SHA1/2. планируется ли поддержка SHA3?
источник