Size: a a a

ClickHouse не тормозит

2020 September 21

U

Ugly in ClickHouse не тормозит
и лезут и лезут..
источник

V

Vladimir in ClickHouse не тормозит
Добрый день!

Подключил clickhouse к Яндекс.DataLens
2 таблицы показываются. Где искать конверсии целей? А то перерыл таблицы и не вижу. :(
источник

VN

Viacheslav Nefedov in ClickHouse не тормозит
A E
Спасибо. Проверю. Я верно понимаю что это лимит на какого-то пользака срабатывает?
а что говорит select *
from system.settings
where name like '%memory%'  ?
источник

VN

Viacheslav Nefedov in ClickHouse не тормозит
ещё вопрос включен ли SQL для конфигурирования
источник

VN

Viacheslav Nefedov in ClickHouse не тормозит
источник

VN

Viacheslav Nefedov in ClickHouse не тормозит
и какая версия CH
источник

AI

An Iv in ClickHouse не тормозит
Artem
у меня задача вместо 13 MV сделать 1 MV c arrayJoin(), что-то вроде

SELECT 
   type,
   symbol,
   interval,
   count()
FROM
(
   SELECT
       type,
       symbol,
       arrayJoin(['1m', '5m', '15m']) AS interval,
       trade_time
   FROM trades
   PREWHERE toYYYYMM(trade_time) = 201709
)
GROUP BY
   type,
   symbol,
   interval,
   transform(interval, ['1m', '5m', '15m'], [toStartOfInterval(trade_time, toIntervalMinute(1)), toStartOfInterval(trade_time, toIntervalMinute(5)), toStartOfInterval(trade_time, toIntervalMinute(15))], now()) AS int
ORDER BY
   type ASC,
   symbol ASC,
   interval ASC

, но оно так не работает.

То есть я сразу хочу агрегировать для разных интервалов времени в одну таблицу,  а потом фильтровать только пятиминутки, например для каждого symbol. Мне кажется, это будет эффективнее, чем 13 отдельных MV
😠
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Sergey Platonov
напомню, что речь шла про запрос с внешнем соединением, и при чем тут хранение не очень понятно
ржачь конечно, но источник проблемы: к сожалению в 75 году в процессоре intel забыли поддержать Null.
приходится извращаться.

проблема не в хранении на диске, хотя это тоже огромная проблема.
проблема в том как Null представлены в памяти, и почему операции с Nullable колонками в ПАМЯТИ требуют сильно больше памяти и в 2 раза медленнее работают.
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Евгений Овчинников
Как отреагирует CH на падение кластера zookeeper? распределенные таблицы уйдут в read only, что-то еще произойдет страшное?
Если представить что все сервера zoo будут заменены. Клик хаус сможет дальше с новым кластером работать (конфиги будут исправлены или новый кластер будет с теми же адресами и именами - замена железа, переустановка системы)?
база зукипера очень важна, придется пересоздавать Replicated таблицы и переналивать реплики если ее потерять
источник

НБ

Никита Бафометович... in ClickHouse не тормозит
Есть таблица localization_history_queue у нее движок kafka и в нее пишуться сообщения с бэка, так же присутствует materialized вьюха которая должна аггрегировать записи из таблицы с движком кафки и писать в таблицу localization_history типа CollapsingMergeTree. Но проблема в том что в последнюю таблицу ничего не пишется, в чем может быть дело?

DDL’ка вьюхи:
CREATE MATERIALIZED VIEW localization_history_consumer TO localization_history
(
   timestamp DateTime,
   user_id String,
   group_id String,
   latitude Float32,
   longitude Float32,
   state String,
   place_id String,
   accuracy Float32,
)
AS
SELECT toDateTime(substr(toString(timestamp), 1, 10)) AS timestamp,
      user_id,
      group_id,
      latitude,
      longitude,
      state,
      place_id,
      accuracy
FROM localization_history_queue;
источник

AM

Alexey Milovidov in ClickHouse не тормозит
Sergey
@milovidov_an подскажите пожалуйста где можно почитать какие останутся потенциальные возможности по потере данных после реализации WAL+fsync в clickhouse?
Повреждение данных на диске после записи (bit rot) или в момент записи (RAID write hole) приводит к потере части данных на одной из реплик. Если реплик более одной, то потеря записанных данных имеет очень небольшую вероятность. Впрочем, если данные реплицированы в разных датацентрах, то включение fsync уже даёт не так много преимуществ.
источник

DV

Dmitry Vasiliev in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
ржачь конечно, но источник проблемы: к сожалению в 75 году в процессоре intel забыли поддержать Null.
приходится извращаться.

проблема не в хранении на диске, хотя это тоже огромная проблема.
проблема в том как Null представлены в памяти, и почему операции с Nullable колонками в ПАМЯТИ требуют сильно больше памяти и в 2 раза медленнее работают.
>к сожалению в 75 году в процессоре intel забыли поддержать Null
а где можно прочитать подробнее? 🙏
источник

ЕО

Евгений Овчинников... in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
база зукипера очень важна, придется пересоздавать Replicated таблицы и переналивать реплики если ее потерять
Спасибо
источник

S

Sergey in ClickHouse не тормозит
Alexey Milovidov
Повреждение данных на диске после записи (bit rot) или в момент записи (RAID write hole) приводит к потере части данных на одной из реплик. Если реплик более одной, то потеря записанных данных имеет очень небольшую вероятность. Впрочем, если данные реплицированы в разных датацентрах, то включение fsync уже даёт не так много преимуществ.
Спасибо большое за ответ
источник

AE

A E in ClickHouse не тормозит
Viacheslav Nefedov
а что говорит select *
from system.settings
where name like '%memory%'  ?
distributed_aggregation_memory_efficient 0
aggregation_memory_efficient_merge_threads 0
memory_tracker_fault_probability 0
max_memory_usage 512000000000
max_memory_usage_for_user 512000000000
max_memory_usage_for_all_queries 512000000000
memory_profiler_step 0
источник

AE

A E in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
Memory limit (for query) exceeded:  -- maximum: 488.28 MiB
это однозначно указывает max_memory_usage не 200G, а 488.28

от пользователя которому прилетела ошибка  select * from system.settings where name = 'max_memory_usage'
distributed_aggregation_memory_efficient 0
aggregation_memory_efficient_merge_threads 0
memory_tracker_fault_probability 0
max_memory_usage 512000000000
max_memory_usage_for_user 512000000000
max_memory_usage_for_all_queries 512000000000
memory_profiler_step 0
источник

VN

Viacheslav Nefedov in ClickHouse не тормозит
ну вроде на сервере ограничений нет, значит в профиле у пользователя есть
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Dmitry Vasiliev
>к сожалению в 75 году в процессоре intel забыли поддержать Null
а где можно прочитать подробнее? 🙏
это шутка была.

Я сразу скажу я не программист, программирую только на bash.

Все базы реализовали хранение и представление Null по разному. Например Informix зарезервировал во всех типах одно из значений как Null, а в INT32 нельзя сохранить -4294967295 , потому что этим значением хранится Null. Оракл хранит Null отдельно в битовых массивах. И т.д.

Теперь мы реализуем операцию sum() в КХ и посылаем адрес вектора который надо просуммировать в SSE, и все как бы просто и работает, пока нет Null. И как ни храни, как Null не представляй надо делать какие-то извращения, и писать какие-то if.
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
A E
distributed_aggregation_memory_efficient 0
aggregation_memory_efficient_merge_threads 0
memory_tracker_fault_probability 0
max_memory_usage 512000000000
max_memory_usage_for_user 512000000000
max_memory_usage_for_all_queries 512000000000
memory_profiler_step 0
у каждого пользователя свои параметры + пользователь может поменять настройки в сессии.

никто вам не поможет разобраться в этом чате. Я таких багов не помню, а читаю весь КХ гитхаб и все чаты.
98% что это в вашем коде, сможете воспроизвести / сделать пример , создавайте bug в гитхабе
источник

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Viacheslav Nefedov
ну вроде на сервере ограничений нет, значит в профиле у пользователя есть
system.settings показывает не сервер. А состояние сессии.
источник