криво, и не особо читабельно, возможно, но хоть как-то объяснить ситуацию поможет.
в общем у нас запрос влетает h2, он отправляет в бэк запросы нормально через отдельные коннекты(дефолтно до 1024, вроде), и даже в разные поды. а вот назад начинаются проблемы. если, например, первым ответит запрос за 60мс с 15Мб данных, а дальше за большее время ответят маленькие запросы. то в клиента через h2 эти запросы и вернутся в этомже порядке. с задержками необходимыми для передачи данных уже клиенту. Например, теже 15Мб клиенту будут доставляться 3 секунды. соответственно пока этот первый запрос относительно ингресса не долетит до клиента, он не начнет отправлять остальные «маленькие».
соответственно, если быстрее ответят «маленькие запросы», то большой пойдет в последнюю очередь