Ну типа 128 это вроде макс.размер очереди блокдевайса в линуксе по дефолту, у сата максимум 32, но на нвме бывает нужно побольше. А 16 по 4МБ обычно достаточно, чтобы загрузить диск линейно. Больше уже чуть тест тупить начинает, т.к много памяти выделяется на буферы, а меньше загрузить диск не всегда хватает
Это зависит от конфигурации стенда (сколько ВМ, хостов, etc), характеристик и типа хранилища, используемого железа и ещё миллионов параметров. Обычно если мы тестируем иммено схд синтетикой (т.е. Пытаемся понять возможности хранилища, а не воспроизводим наш профиль) снимают curve, что определить диапазоны недозагрузки, рабочий диапазон, перегрузку. Отсюда строится график iops+latency от iodepth, после чего очевидно сколько нужно потоков, чтобы загрузить хранилище. Часто этого достаточно. Если нужно совсем точно и занудно, то на выбираем iodepth c линейного участка на прошлом графике и начинаем менять iops rate - получаем график latency от iops. После чего отсекаем требуемый нам уровень latency (ибо это характеристика приложения, а не схд) и получаем число - сколько iops нам готово выдать хранилище при latency не превышающем порог