Size: a a a

Ceph — русскоговорящее сообщество

2020 June 24

ДА

Денис Андреев... in Ceph — русскоговорящее сообщество
Vyacheslav Olkhovchenkov
а ты расчитывал что оно будет писать на несколько дисков ожидая подтверждения от соседей со скоростью выше чем у отдельного диска?
я не знаю как относиться к полученным результатам при тестировании большого количества ВМ, но прекрасно понимаю, что на момент тестирования кластера Red Hat(тесты проводились только на 1-2 ВМ, так как было не очень удобно через libvirt) ошибки slow ops, как правило, возникали в промежутках между тестами, вот в таких глупых случаях, когда уже как 10 минут все тесты прошли, а при попытке создать файловую систему, клиентская машина с диском РБД полностью виснит на протяжении 10-20-30 а иногда даже 40 минут
источник

ДА

Денис Андреев... in Ceph — русскоговорящее сообщество
я чередовал fio и dd, и всего одна машина была способна зафризить весь пул на запись
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
давай разделять теплое с мягким
источник

b

blkmrkt in Ceph — русскоговорящее сообщество
Собираю цеф - заказываю домой серверный шкаф и собираюсь протестировать оборудование прежде чем ставить все в ДЦ. Собирать кластер буду из магнитных 3,5 дисков, нагрузка будет небольшая, в основном на запись и редкое чтение - то с чем сейчас AWS S3 справляется за ~$5k в месяц.

- Какие свищи посоветуете?
- Сколько нод и сколько OSD на ноду, как вообще это рассчитать? Делать новую ноду только если насытил PCIe лейны на предыдущей?
- Диски буду брать IronWolf 4TB и наверное ставить в отдельные шасси с HBA. Какие подводные?
- Куда ставить ОС? На отдельный SSD/NVMe или mdRAID1 из 2 блокдевайсов?
источник

ДА

Денис Андреев... in Ceph — русскоговорящее сообщество
про raid можно не говорить, это изощрения последнего времени(мы просто уже не знаем куда копать), сами по себе диски мы проверяли, между ними есть разница, я не могу судить как эксперт, но эта разница на мой взгляд не такая большая
источник

ДА

Денис Андреев... in Ceph — русскоговорящее сообщество
можно ли как-то при появлении slow ops проверить ту OSD, которая их создает
источник

AP

Alexander Patrakov in Ceph — русскоговорящее сообщество
источник

ДА

Денис Андреев... in Ceph — русскоговорящее сообщество
Vyacheslav Olkhovchenkov
в любом случае на 66 hdd c репликацией 3 больше 1300 iops суммарно странно ожидать.
и что там за raid0 упоминались?
спасибо за цифры
источник

ДД

Дмитрий Дятлов... in Ceph — русскоговорящее сообщество
Денис Андреев
спасибо за цифры
1/2 есть на hdd
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
blkmrkt
Собираю цеф - заказываю домой серверный шкаф и собираюсь протестировать оборудование прежде чем ставить все в ДЦ. Собирать кластер буду из магнитных 3,5 дисков, нагрузка будет небольшая, в основном на запись и редкое чтение - то с чем сейчас AWS S3 справляется за ~$5k в месяц.

- Какие свищи посоветуете?
- Сколько нод и сколько OSD на ноду, как вообще это рассчитать? Делать новую ноду только если насытил PCIe лейны на предыдущей?
- Диски буду брать IronWolf 4TB и наверное ставить в отдельные шасси с HBA. Какие подводные?
- Куда ставить ОС? На отдельный SSD/NVMe или mdRAID1 из 2 блокдевайсов?
1. я бы не стал брать ничего сигейтовского в районе 0.5-4ТБ
2. hdd невозможно насытить pcie
3. ос ставить только отдельно. дальше -- по вкусу
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
Денис Андреев
про raid можно не говорить, это изощрения последнего времени(мы просто уже не знаем куда копать), сами по себе диски мы проверяли, между ними есть разница, я не могу судить как эксперт, но эта разница на мой взгляд не такая большая
если он есть про него нельзя не говорить
источник

ДА

Денис Андреев... in Ceph — русскоговорящее сообщество
Дмитрий Дятлов
1/2 есть на hdd
пик IOPS составляет примерно 1.4к на очень короткое время, бывает задерживается на 1.2к, за это немедленно наступает расплата, ceph -s сразу начинает выдавать большое количество slow ops
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
Денис Андреев
вот эта картина происходила уже после тестов, при попытке выполнить команду mkfs.xfs на подключенный rbd диск
ну тут да, интересно что в этот момент происходило... подампи slow_ops-ы из админсокета
источник

ВН

Виталий На Заборе... in Ceph — русскоговорящее сообщество
Денис Андреев
можно ли как-то при появлении slow ops проверить ту OSD, которая их создает
ceph daemon osd.0 dump_historic_slow_ops
источник

ДД

Дмитрий Дятлов... in Ceph — русскоговорящее сообщество
Денис Андреев
пик IOPS составляет примерно 1.4к на очень короткое время, бывает задерживается на 1.2к, за это немедленно наступает расплата, ceph -s сразу начинает выдавать большое количество slow ops
давайте не будем,
во первых, кластер используется для специфических целей.
Во вторых, там реально только hdd
И без всяких slow ops
источник

ДА

Денис Андреев... in Ceph — русскоговорящее сообщество
также считаю важным уточнить, что при тестировании одиночной ВМ, первыми следами slow ops являлось зависшая операция(обычно при попытке записи первых блоков), однако это не являлось 100% закономерностью
источник

b

blkmrkt in Ceph — русскоговорящее сообщество
Vyacheslav Olkhovchenkov
1. я бы не стал брать ничего сигейтовского в районе 0.5-4ТБ
2. hdd невозможно насытить pcie
3. ос ставить только отдельно. дальше -- по вкусу
Спасибо за ответы!

Не подскажете конкретный стакабельный свитч на 10гиг?

Как решать когда добавлять новую ноду, существует ли универсальный рецепт?
источник

VO

Vyacheslav Olkhovche... in Ceph — русскоговорящее сообщество
blkmrkt
Спасибо за ответы!

Не подскажете конкретный стакабельный свитч на 10гиг?

Как решать когда добавлять новую ноду, существует ли универсальный рецепт?
Что значит стакебельный? Ну в смысле -- нахера такое своейство? А то разные вендоры разное под этим понимают
источник

ДД

Дмитрий Дятлов... in Ceph — русскоговорящее сообщество
blkmrkt
Спасибо за ответы!

Не подскажете конкретный стакабельный свитч на 10гиг?

Как решать когда добавлять новую ноду, существует ли универсальный рецепт?
сиськи конечно же (cisco)
источник

b

blkmrkt in Ceph — русскоговорящее сообщество
Vyacheslav Olkhovchenkov
Что значит стакебельный? Ну в смысле -- нахера такое своейство? А то разные вендоры разное под этим понимают
В этом чате сказали что стакабельный свищ обязателен, мол ни о чем другом даже не стоит думать
источник