здрасти. вопрос к экспертам. нода хранения, 12 шпинделей для данных, 1 nvme для block.db. в произвольный момент начинаются slow ops вида "log_latency slow operation observed for kv_commit, latency = 22.5964s", затем куча вида "log_latency_fn slow operation observed for _txc_committed_kv, latency = 226.41s, txc = 0x35b1b000" и затем все osd на этой ноде отстреливаются.
есть теория, что поскольку осд запускаются примерно в один момент времени, они примерно в один момент и compact запускают, троттля таким образом nvme. имеет такая теория право на жизнь?
ну или гнилой nvme?
наутилус последний, 14.2.22, обновился на свою голову. osd_scrub_sleep выставлен в 0.2, osd_scrub_chunk_max и osd_scrub_chunk_min по единичке