Телеграмм чат группы ceph_ru страница 11535

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Ceph — русскоговорящее сообщество

1705 membersпожаловаться на группу

2021 August 18

AN

Andrey Nemysskiy in Ceph — русскоговорящее сообщество

Это все на случай, если надо временно (на часы) вывести ноду из эксплуатации.
Если это дни, то лучше с OSD этих дисков убрать данные (ceph osd out номер_osd) , дождаться ребалансировки, а уж потом выводить ноду.

источник

13:55пожаловаться #1

R

Roman in Ceph — русскоговорящее сообщество

Если цепх 16 и развернут cephadm, то есть флаг maintenance

источник

14:06пожаловаться #2

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество

меня тут пытались на cephadm охмурить

источник

14:13пожаловаться #3

ИЕ

Иван Епифанов... in Ceph — русскоговорящее сообщество

Спасибо большое

источник

14:14пожаловаться #4

ИЕ

Иван Епифанов... in Ceph — русскоговорящее сообщество

Ceph nautilus

источник

14:14пожаловаться #5

2021 August 19

R

R-omk in Ceph — русскоговорящее сообщество

Подскажите (хоть что нибудь) , может кто сталкивался,

после бэкфила pg (erasure pool ; cephfs ) osd с которой уехали данные начинает освобождать место что ли , так вот из за этого процесса начинает дико тормозить client io, фактически в нули останавливается единственное что можно в этой ситуации сделать это просто полностью вырубить osd ,
никакие отключения ребалансировок или установка primary-affinity в ноль не помогает, если osd включить то она опять что-то делает такое что мешает обслуживать client io и все укладывается.
..

ceph version 14.2.9

я уже почти месяц почти в ручном режиме слежу за перебалансировкой чтобы вовремя вырубить osd, если в системе одна такая osd которая чистит диск то она хоть как то шевелится, если появится еще одна то хана .

по метрикам видно что osd которая, видимо, удаляет остатки pg начинает потреблять больше cpu , но не критично, при этом утилизация диска может быть и сотка, а может быть и совсем помелочи после перезапуска , т.е. какойто рандом. он может с диска то под 100MB/s читать, то сидеть в своем обычном режиме с 4MB/s

и это я уже молчу про то как он pg-osd перераспределил при добавлении osd, oн для erasure почти везде тупо переставил позиции чанков (на хост один osd hdd, и для правила failure Domain это хост ) типа стало[1, 8, 10, 5, 7] было[6,8,7,5,10] ,т.е. накойто хер переставил 10 и 7 местами из за чего ребалансировка еще усложнилась (видимо этот факт еще и привел к знаменитой проблеме когда половина pg застряла в статусе `backfill_tofull), при этом на такую перестановку `Max Backfills не влияет (видимо потому что в пределах одного pg), из за чего фактически пришлось руками останваливать сперва 7 osd а потом 10 osd ,

короче полный пез*дос

источник

12:34пожаловаться #6

k

k0ste in Ceph — русскоговорящее сообщество

Обновись до 14.2.22+, как раз месяц сохранишь

источник

12:39пожаловаться #7

R

R-omk in Ceph — русскоговорящее сообщество

это пока единственно что я могу сделать, однако я хочу дождатсья когда оно хоть както придет в номрально состояние, ибо обновляться при текущем раскладе крайне ссыкотно

источник

12:41пожаловаться #8

R

R-omk in Ceph — русскоговорящее сообщество

одно дело просто говорить что нужно обновиться, друге дело знать о том что там действительно могли быть пофикшены баги связанные с описаной симптоматикой.

источник

12:43пожаловаться #9

k

k0ste in Ceph — русскоговорящее сообщество

То есть вариант что тебе говорят и знают в чем проблема ты не рассматриваешь по дефолту?

источник

12:44пожаловаться #10

R

R-omk in Ceph — русскоговорящее сообщество

рассматриваю) я сейчас уже все варианты рассматриваю 🤷‍♀️

источник

12:45пожаловаться #11

AN

Andrey Nemysskiy in Ceph — русскоговорящее сообщество

С приоритетом дисковых операций не игрался? Или это не влияет?

источник

12:46пожаловаться #12

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество

А что за баг к слову?

источник

12:50пожаловаться #13

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество

Я вроде пока на наутилусе сидел не натыкался

источник

12:50пожаловаться #14

k

k0ste in Ceph — русскоговорящее сообщество

С удалением или с подсчётом места или с внезапным окончанием WAL или ещё чем?)

источник

12:51пожаловаться #15

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество

Ну то что он озвучил - с тормозами при чистке пг

источник

12:52пожаловаться #16

k

k0ste in Ceph — русскоговорящее сообщество

Для этого должно быть нормально объектов, на RBD кластерах это не поймать

источник

12:52пожаловаться #17

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество

А......кстати же да

источник

12:52пожаловаться #18

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество

Был же там какой-то баг с медленным удалением pg

источник

12:52пожаловаться #19

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество

Точно

источник

12:52пожаловаться #20