D
мониторы и mgrы на них же.
128 гиг памяти
Сетевухи mellanox lx-4 2x10GE LACP.(cluster netowrk) 2x10GE (client)
на ssd дисках, где я тестировал 1 пул minsize 2 , 3replica. + еще несколько не используются..
ну еще несколько пулов на hdd..
Постоянная нагрузка примерно 300op/s 8MB/s на hdd пул.
pools: 10 pools, 1993 pgswal у меня 2 GB а rocks 300GB(, на тех же ssd.) max_bytes_for_level_base=256MB.
objects: 721.60k objects, 2.7 TiB
usage: 13 TiB used, 229 TiB / 242 TiB avail
pgs: 1993 active+clean
вообще процесс пиринга я понимаю весьма поверхностно, вероятно Виталий мог бы более детально прокоментировать, но при синхронизации pg_log и при сравнении epoch и состояния групп, насколько я понимаю медленные диски не должны вызывать задержку (именно во время пирринга).
У вас пока 30 секунд фриз - что ceph -s пишет про PG?