Я обычно делаю иначе. Берешь некий профиль и начинает последовать увеличивать TxQx (например, 1, 4, 8, 12, 16, 24, etc). На графике будет явно видны зоны недогруза, рабочий режим и перегруженный. Плюс latency vs IOPS. Это быстро и грязно. Если нужны детали, то выбираем рабочую точку и фигачим ряд тестов с разным IOPS Limit