Насколько я помню в сжатом h264 звук тоже сжимается до максимальных 320 kbps. Проще выведите отдельно wav и отдельно видео, а потом соберут вместе в нужный формат
А как вот собрать это все?) тут как раз в этом проблема. Так то понятно, что отдельно все выводится — где склеивать так, чтобы форматы и кодеки остались такими, какие они есть
Если проблема в передаче большого объема звукорежисерру, то проще отдать ему видео в h264, а звук в несжатом. Когда он закончит свою часть работы можно будет собрать нужное