Size: a a a

ClickHouse не тормозит

2021 January 09

NT

Nikita Tikhomirov in ClickHouse не тормозит
Смерть данных - не страшно особо
источник

SC

Smoked Cheese in ClickHouse не тормозит
Nikita Tikhomirov
Думаю около 15-20MBPS в пик
Это сжатых или сырых?
источник

NT

Nikita Tikhomirov in ClickHouse не тормозит
Smoked Cheese
Это сжатых или сырых?
Сырых
источник

SC

Smoked Cheese in ClickHouse не тормозит
Ну это копейки вообще
источник

SC

Smoked Cheese in ClickHouse не тормозит
Можно и хдд
источник

SC

Smoked Cheese in ClickHouse не тормозит
На ssd, правда, приятнее читать будет
источник

GK

Georgiy Kashintsev in ClickHouse не тормозит
Dmitry Polyakov
при больших объемах данных на рейдах из хдд (>1TB полезных данных), при выходе диска из строя - умрете на ребилде =)
можно использовать raid0 и не страдать
источник

DP

Dmitry Polyakov in ClickHouse не тормозит
Georgiy Kashintsev
можно использовать raid0 и не страдать
ну да, только въезжать диски будут все равно - и это в любом случае будет либо долго, либо влиять на производительность.  🙂
источник

DP

Dmitry Polyakov in ClickHouse не тормозит
Nikita Tikhomirov
Смерть данных - не страшно особо
если нестрашно  и 20МБ сырых - то смело ставьте хдд и не парьтесь.
источник

n🐈

nikoinlove 🐈 in ClickHouse не тормозит
так говорите как будто ссд при ребилде не деградируют по скорости)
источник

s

sexst in ClickHouse не тормозит
Georgiy Kashintsev
можно использовать raid0 и не страдать
Нечасто увидишь "raid0" и "не страдать" в одном предложении
источник

GK

Georgiy Kashintsev in ClickHouse не тормозит
sexst
Нечасто увидишь "raid0" и "не страдать" в одном предложении
потому что не так распространен raid0, соответственно утверждения встречаются редко :)
источник

DP

Dmitry Polyakov in ClickHouse не тормозит
все деградирует, даже нвме 🙂 тут вопрос, скорее, что когда выбирают хдд - обычно думают только о нормальном режиме работы, про условный дегрейд режим и восстановление после него - не думают, а обычно запаса производительности у хдд уже не хватает. и в итоге у всех шок, что "база будет тормозить еще N дней,  потому что меняется диск" 🙂
источник

DM

Danila Migalin in ClickHouse не тормозит
База без реплик = данные не нужны ;)
источник

D

Dj in ClickHouse не тормозит
Danila Migalin
База без реплик = данные не нужны ;)
"replication is not backup"...
источник

DM

Danila Migalin in ClickHouse не тормозит
Я и не говорил что бэкап не нужен, впрочем
источник

e

er@essbase.ru in ClickHouse не тормозит
Разумный ли подход :  хочу обсчитывать данные , которые лежат в кластере CH  возвращать в CH.  Новую порцию лить в свежую таблицу и подменивать партицию в исходной.  Планирую использовать Apache Spark для расчетов .    * нет никаких идей как это лучше приготовить?)
источник

VN

Viacheslav Nefedov in ClickHouse не тормозит
er@essbase.ru
Разумный ли подход :  хочу обсчитывать данные , которые лежат в кластере CH  возвращать в CH.  Новую порцию лить в свежую таблицу и подменивать партицию в исходной.  Планирую использовать Apache Spark для расчетов .    * нет никаких идей как это лучше приготовить?)
Делали так раньше. Запускали на airflow pyspark. В clickhouse можно использовать ReplacingMergeTree если подходит
источник
2021 January 10

DC

Denny Crane [not a Y... in ClickHouse не тормозит
Dmitry Polyakov
при больших объемах данных на рейдах из хдд (>1TB полезных данных), при выходе диска из строя - умрете на ребилде =)
да ладно. Годами все работает на hdd

df -h /
Filesystem      Size  Used Avail Use% Mounted on
/dev/md0         46T   38T  7.8T  83% /
источник

DP

Dmitry Polyakov in ClickHouse не тормозит
Denny Crane [not a Yandex bot]
да ладно. Годами все работает на hdd

df -h /
Filesystem      Size  Used Avail Use% Mounted on
/dev/md0         46T   38T  7.8T  83% /
Умрете - я не про потерю данных, а про сам синк и перформанс. У меня у самого примерно такие же цифры, достаточно интенсивный регулярный поток без пиков и поэтому замена дисков затягивается :)
источник