Size: a a a

ClickHouse не тормозит

2020 July 30

S

Slach in ClickHouse не тормозит
Михаил Цветков
спасибо! а сырые данные по хитам (clickstream log) постфактум экспортировать можно?
да
но они не настолько сырые и есть ограничение на диапозон и одновременное кол-во потоков скачивания смотрите лимиты в Logs API
источник

DN

Dmitriy Novikov in ClickHouse не тормозит
Михаил Цветков
Ребята, привет! Кто может помочь вытащить и проанализировать данные о поведении пользователей на сайте?

Есть данные об 1 млн посетителей сайта в системах Яндекс метрика и Google analitics.
Необходимо смэтчить эти данные и вычленить из них поведенческие характеристики, по каждому пользователю и по каждой из его сессий:
- порядок и скорость перехода по страницам сайта
- поведение на каждой из страниц (тепловая карта)
- запросы / площадки с которых пришел
- соц-дем

Полученные данные проанализировать на предмет схожести.
Работа оплачиваемая, детали скину в личку!
Кстати если хотите кликстрим сделать через счетчик, можно стримить данные из GA к себе через customTask. Поищите в гугле, есть даже готовые решения для этого.
источник

S

Slach in ClickHouse не тормозит
Dmitriy Novikov
Кстати если хотите кликстрим сделать через счетчик, можно стримить данные из GA к себе через customTask. Поищите в гугле, есть даже готовые решения для этого.
источник

DN

Dmitriy Novikov in ClickHouse не тормозит
например да, хм... вот думаю, стоит ли go учить?
источник

AV

Alexander Vaskin in ClickHouse не тормозит
всем привет! а можно где-то в clickhouse глянуть причину 400 Bad Request (jdbc driver)?
источник

S

Slach in ClickHouse не тормозит
Dmitriy Novikov
например да, хм... вот думаю, стоит ли go учить?
если придется писать что-то более производительное чем python то да
если вы просто аналитик, то python лучший выбор
источник

DN

Dmitriy Novikov in ClickHouse не тормозит
Slach
если придется писать что-то более производительное чем python то да
если вы просто аналитик, то python лучший выбор
уже не просто аналитик
источник

МЦ

Михаил Цветков... in ClickHouse не тормозит
Спасибо! Подскажите, данные за прошлый период (уже произошедшие и сохранённые в аналитике) можно в «сыром» залить в кликхаус?
источник

S

Slach in ClickHouse не тормозит
Михаил Цветков
Спасибо! Подскажите, данные за прошлый период (уже произошедшие и сохранённые в аналитике) можно в «сыром» залить в кликхаус?
нет это просто плагин для analytics.js довольно старый, который стримит данные напрямую в clickhouse
источник

E

Eugeny in ClickHouse не тормозит
Я правильно понимаю что все параметры из этой[1] доки применяются на самом верхнем уровне конфига кликхауса? Т.е включение max_network_bytes будет выглядеть так:
<yandex>
   <max_network_bytes>20971520</max_network_bytes>
</yandex>


[1]  https://clickhouse.tech/docs/en/operations/settings/settings/
источник

NV

Nicolae Vartolomei in ClickHouse не тормозит
is it possible to add SAMPLE expression after table was created? if not, why?
источник

E

Eugeny in ClickHouse не тормозит
Eugeny
Я правильно понимаю что все параметры из этой[1] доки применяются на самом верхнем уровне конфига кликхауса? Т.е включение max_network_bytes будет выглядеть так:
<yandex>
   <max_network_bytes>20971520</max_network_bytes>
</yandex>


[1]  https://clickhouse.tech/docs/en/operations/settings/settings/
Отвечаю сам:

A setting 'max_network_bytes' appeared at top level in config /etc/clickhouse-server/config.xml. But it is user-level setting that should be located in users.xml inside <profiles> section for specific profile. You can add it to <profiles><default> if you want to change default value of this setting. You can also disable the check - specify <skip_check_for_incorrect_settings>1</skip_check_for_incorrect_settings> in the main configuration file.
источник

E

Eugeny in ClickHouse не тормозит
И сразу следующий вопрос: как лимитировать network bandwidth между двумя нодами кликхауса при репликации? Надеялся что max_network_bytes срабоатет в этом случае, но нет
источник

PN

Petr Nepochatyh in ClickHouse не тормозит
приветствую, можете подсказать по clickhouse-copier, есть 2кх (20.4.6.53), таблица c движком ReplacingMergeTree

после запуска копира выполняется сама миграция, по окончанию копир говорит, что все выполнено успешно
но размер и количество строк отличается от исходного кластера, в чем может быть проблема?
источник

YV

Yuri Velgosha in ClickHouse не тормозит
Petr Nepochatyh
приветствую, можете подсказать по clickhouse-copier, есть 2кх (20.4.6.53), таблица c движком ReplacingMergeTree

после запуска копира выполняется сама миграция, по окончанию копир говорит, что все выполнено успешно
но размер и количество строк отличается от исходного кластера, в чем может быть проблема?
Ну т.к. КХ не поддерживает транзакции, это, кажись, логично...
Заливка данных в исходный кластер не прекращалась во время миграции?
источник

PN

Petr Nepochatyh in ClickHouse не тормозит
в те партиции, где не хватает строк уже прекращена запись
источник

YV

Yuri Velgosha in ClickHouse не тормозит
А если попробовать тупо INSERT INTO... SELECT * from remote()...?
источник

AT

Al T in ClickHouse не тормозит
случилась амнезия и забыл (или не знал никогда) - в том случае когда у нас несколько шардов - если запись в distributed table то он раскидывает по шардам в зависимости от partition key? но при этом же можно взять и напрямую в любой партишен записать - и тогда кликхаус смотрит в зукипере с какого шарда читать?
источник

МЦ

Михаил Цветков... in ClickHouse не тормозит
В logs api  среди параметров по просмотрам есть такой параметр, как «параметр просмотра, ур 1-10»

ym:pv:parsedParamsKey1
Параметры просмотра, ур. 1
ym:pv:parsedParamsKey2
Параметры просмотра, ур. 2
ym:pv:parsedParamsKey3
Параметры просмотра, ур. 3

Кто-нибудь знает что показывает этот параметр? Подскажите пожалуйста
источник

NB

Nikolay Bogdanov in ClickHouse не тормозит
Al T
случилась амнезия и забыл (или не знал никогда) - в том случае когда у нас несколько шардов - если запись в distributed table то он раскидывает по шардам в зависимости от partition key? но при этом же можно взять и напрямую в любой партишен записать - и тогда кликхаус смотрит в зукипере с какого шарда читать?
ничего он не смотрит. Он читает со всех шардов из случайной реплики.
источник