Size: a a a

Ceph — русскоговорящее сообщество

2021 March 03

IF

Irek Fasikhov in Ceph — русскоговорящее сообщество
Denis
надо как вам выше советовали снижать интенсивность восстановления
ниче ты не понял. Есть два этапа при восстановлениях.
источник

IF

Irek Fasikhov in Ceph — русскоговорящее сообщество
фриз возникает при пирингах(во время запуска osd), а просадка при восстановление - крутится параметрами.
источник

D

Denis in Ceph — русскоговорящее сообщество
Да, но пиринг с 30 секундами фриза :)
источник

ПС

Павел Савин... in Ceph — русскоговорящее сообщество
Как я понял фриз это из-за offline->peering (лечится задержкой запуска osd) .
А а как начинается рековери идет просадка по iops - это тюнить приоритетами.
источник

IF

Irek Fasikhov in Ceph — русскоговорящее сообщество
можно еще попробовать снизить эффект через  primary affinity....надо будет попробовать))
источник

D

Denis in Ceph — русскоговорящее сообщество
Особенно в тестовом кластере, в котором нет большого количества данных, скорее всего
источник

IF

Irek Fasikhov in Ceph — русскоговорящее сообщество
Denis
Да, но пиринг с 30 секундами фриза :)
ты наверное в проц упираешься в такие моменты?
источник

D

Denis in Ceph — русскоговорящее сообщество
Вчера делался рестарт 80 осд, в группах по 5
источник

ПС

Павел Савин... in Ceph — русскоговорящее сообщество
Проц проседает в этот момент, context switching сильно вырастает.
источник

D

Denis in Ceph — русскоговорящее сообщество
2.5ТБ на каждом диске примерно.  Все без фризов и под постоянной нагрузкой 600-700 миб/с на запись и чтение. Пирринг и рекавери 10-15 секунд, без проседания практически
источник

D

Denis in Ceph — русскоговорящее сообщество
Думаю у Павла либо как вы заметили не хватает процессора, либо именно рекавери процесс затыкает все остальное. Но 30 секунд пирринг с фризом все же ненормально :)

Павел, вы бы дали больше информации о кластере, если вам интересно дальше копать. А если тестовый и вы пока просто за рычаги дергаете чтоб привыкнуть, то может пока не стоит копать особо :)
источник

ПС

Павел Савин... in Ceph — русскоговорящее сообщество
Denis
Думаю у Павла либо как вы заметили не хватает процессора, либо именно рекавери процесс затыкает все остальное. Но 30 секунд пирринг с фризом все же ненормально :)

Павел, вы бы дали больше информации о кластере, если вам интересно дальше копать. А если тестовый и вы пока просто за рычаги дергаете чтоб привыкнуть, то может пока не стоит копать особо :)
Ну железо и конфигурация переползет в прод в итоге.
источник

D

Denis in Ceph — русскоговорящее сообщество
Павел Савин
Проц проседает в этот момент, context switching сильно вырастает.
Вот тут вам hyperthreading в помощь ;) немного оффтоп но там выше обсуждалось помогает ли  ht
источник

IF

Irek Fasikhov in Ceph — русскоговорящее сообщество
Denis
Думаю у Павла либо как вы заметили не хватает процессора, либо именно рекавери процесс затыкает все остальное. Но 30 секунд пирринг с фризом все же ненормально :)

Павел, вы бы дали больше информации о кластере, если вам интересно дальше копать. А если тестовый и вы пока просто за рычаги дергаете чтоб привыкнуть, то может пока не стоит копать особо :)
на больших кластерах с большим количеством pg это почти нормально ))
источник

D

Denis in Ceph — русскоговорящее сообщество
Irek Fasikhov
на больших кластерах с большим количеством pg это почти нормально ))
Может быть и так, но я не уверен что это нормально ;)
источник

D

Denis in Ceph — русскоговорящее сообщество
Аа, ну да, почти :)
источник

IF

Irek Fasikhov in Ceph — русскоговорящее сообщество
Denis
Аа, ну да, почти :)
ага, фиксанул :)
источник

ПС

Павел Савин... in Ceph — русскоговорящее сообщество
Irek Fasikhov
на больших кластерах с большим количеством pg это почти нормально ))
3 сервера на платформе supermicro SSG-6019P-ACR12L.
6hdd-14tb + 6ssd 2tb, 18osd hdd+ssd(bcache+wal+db)
36 osd - ssd(по два раздела на каждом)
Cpu intel xeon gold 5120, 2.2hgz
источник

ПС

Павел Савин... in Ceph — русскоговорящее сообщество
Врятли это большой кластер..
источник

А🐎

Александр 🐎... in Ceph — русскоговорящее сообщество
Хм, у меня на такое же платформе тоже осд долго рестартятся
источник