Size: a a a

ClickHouse не тормозит

2020 June 23

AS

Aleh Sauko in ClickHouse не тормозит
Denny Crane (I don't work at Yandex (never did))
или ждать или рестартовать, kill ставит флаг в сессии, когда сессия дойдет до проверки флага, он решит завершаться
спасибо понял, а есть приблизительная эвристика, когда он проверяет флаг (например раз в N мин)?

грубо говоря если подвис запрос select * from .., надеятся на то что он дойдет до проверки флага до того как вычитает все данные смысла не имеет?
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Aleh Sauko
спасибо понял, а есть приблизительная эвристика, когда он проверяет флаг (например раз в N мин)?

грубо говоря если подвис запрос select * from .., надеятся на то что он дойдет до проверки флага до того как вычитает все данные смысла не имеет?
там проверка между блоками, если 20 минут висит, можно уже не ждать
источник

AS

Aleh Sauko in ClickHouse не тормозит
понял спасибо
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
у меня правда было что сессия убитая закончилась через 2 дня, но она ждала сеть странно и ничему не мешала
источник

p

pv in ClickHouse не тормозит
Подскажите пожалуйста.
Если делать insert from select такой insert обладает защитой от повторной вставки? По типу той защиты с retry когда вставляешь "теже самые данные" и CH сам понимает, что это уже было вставлено?  Т.е. если он прервётся по ошибке и попробовать его ещё раз запустить, получаться дубли?
источник

YV

Yuri Velgosha in ClickHouse не тормозит
pv
Подскажите пожалуйста.
Если делать insert from select такой insert обладает защитой от повторной вставки? По типу той защиты с retry когда вставляешь "теже самые данные" и CH сам понимает, что это уже было вставлено?  Т.е. если он прервётся по ошибке и попробовать его ещё раз запустить, получаться дубли?
Скорее всего да, если движок таблицы отичается от SummingMergeTree..
источник

p

pv in ClickHouse не тормозит
Yuri Velgosha
Скорее всего да, если движок таблицы отичается от SummingMergeTree..
Ну в данном случае обычный MergeTree.. Точнее в проде это будет ReplicatedMergeTree
источник

p

pv in ClickHouse не тормозит
Я насколько понимаю ещё от количества данных может зависеть. CH вроде запоминает последние сколько то, вот только не помню "вставок" или каких-то своих внутренних "блоков". Хотелось понять нужно ли заботиться об этом при переливке большого объёма.
источник

ИМ

Илья Максимов... in ClickHouse не тормозит
Привет! В проде есть две базы: БД №1 - для таблиц с сырыми данными, а бд №2 для агрегационных. Так как разработчики не могут написать код так, чтобы приложение ходило в две базы одновременно, было решено сделать view в базе №1, чтобы делать запросы над вьюшкой к таблице в базе №2. Вьюшка выглядит что то около:
SELECT все_поля, через_запятую, .... FROM db_№2_aggregates.some_table
. И, оказалось, что если делать какие либо временные, или другие фильтры, то они не работаю, пока не выполнится весь скан, что в целом логично. По крайней мере очень на то похоже. Как выйти из этой ситуации сухим из воды и можно ли каким то образом сделать... аля симлинк чтоли на другую таблицу?
источник

SC

Smoked Cheese in ClickHouse не тормозит
Илья Максимов
Привет! В проде есть две базы: БД №1 - для таблиц с сырыми данными, а бд №2 для агрегационных. Так как разработчики не могут написать код так, чтобы приложение ходило в две базы одновременно, было решено сделать view в базе №1, чтобы делать запросы над вьюшкой к таблице в базе №2. Вьюшка выглядит что то около:
SELECT все_поля, через_запятую, .... FROM db_№2_aggregates.some_table
. И, оказалось, что если делать какие либо временные, или другие фильтры, то они не работаю, пока не выполнится весь скан, что в целом логично. По крайней мере очень на то похоже. Как выйти из этой ситуации сухим из воды и можно ли каким то образом сделать... аля симлинк чтоли на другую таблицу?
можно использовать SELECT ... FROM remote('localhost', db_number_one, table)
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
pv
Подскажите пожалуйста.
Если делать insert from select такой insert обладает защитой от повторной вставки? По типу той защиты с retry когда вставляешь "теже самые данные" и CH сам понимает, что это уже было вставлено?  Т.е. если он прервётся по ошибке и попробовать его ещё раз запустить, получаться дубли?
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Yuri Velgosha
Скорее всего да, если движок таблицы отичается от SummingMergeTree..
ни причем тут SummingMergeTree вообще
источник

PL

Piotr Liakhavets in ClickHouse не тормозит
Илья Максимов
Привет! В проде есть две базы: БД №1 - для таблиц с сырыми данными, а бд №2 для агрегационных. Так как разработчики не могут написать код так, чтобы приложение ходило в две базы одновременно, было решено сделать view в базе №1, чтобы делать запросы над вьюшкой к таблице в базе №2. Вьюшка выглядит что то около:
SELECT все_поля, через_запятую, .... FROM db_№2_aggregates.some_table
. И, оказалось, что если делать какие либо временные, или другие фильтры, то они не работаю, пока не выполнится весь скан, что в целом логично. По крайней мере очень на то похоже. Как выйти из этой ситуации сухим из воды и можно ли каким то образом сделать... аля симлинк чтоли на другую таблицу?
в версии 20.4 вью умеют фильтры прокидывать
и джоин на подзапрос с условиями никто не запрещал
+ разработчиков над подровнять... или полиси
источник

p

pv in ClickHouse не тормозит
Ага. Спасибо большое.
источник

DC

Denny Crane (I don't... in ClickHouse не тормозит
Илья Максимов
Привет! В проде есть две базы: БД №1 - для таблиц с сырыми данными, а бд №2 для агрегационных. Так как разработчики не могут написать код так, чтобы приложение ходило в две базы одновременно, было решено сделать view в базе №1, чтобы делать запросы над вьюшкой к таблице в базе №2. Вьюшка выглядит что то около:
SELECT все_поля, через_запятую, .... FROM db_№2_aggregates.some_table
. И, оказалось, что если делать какие либо временные, или другие фильтры, то они не работаю, пока не выполнится весь скан, что в целом логично. По крайней мере очень на то похоже. Как выйти из этой ситуации сухим из воды и можно ли каким то образом сделать... аля симлинк чтоли на другую таблицу?
create table as remote(
источник

ИМ

Илья Максимов... in ClickHouse не тормозит
remote звучит неплохо, возьму на вооружение, спасибо
источник

ИМ

Илья Максимов... in ClickHouse не тормозит
Piotr Liakhavets
в версии 20.4 вью умеют фильтры прокидывать
и джоин на подзапрос с условиями никто не запрещал
+ разработчиков над подровнять... или полиси
Надо бы проверить версию кх, спасибо за наводку
источник

ИМ

Илья Максимов... in ClickHouse не тормозит
А разрабы да, они у нас одарённые ребята
источник

DP

Dorian Peregrim in ClickHouse не тормозит
Добрый день. Такой вопрос. У CH, насколько я понял, в логике имеется дедупликация данных. Если это так, то можно ли это как то выключить?
источник

Н

Николай in ClickHouse не тормозит
Dorian Peregrim
Добрый день. Такой вопрос. У CH, насколько я понял, в логике имеется дедупликация данных. Если это так, то можно ли это как то выключить?
источник