Что касается замены имён, можно попробовать генерировать несколько саммари, выделять все именованные сущности NER'ом, и понижать приоритет тех саммари, в которых появились сущности, не упомянутые в исходном тексте.
Какое ваше мнение по целесообразности дообучения модели byT5 на русском языке для исправления опечаток (в частности после ASR)? Судя по опыту одной обученной сетки для немецкого языка - выглядит неплохо https://huggingface.co/flozi00/byt5-german-grammar. По информации он обучал на 600 000 текстах. Осталось научиться генерировать аналогичные ошибки для системы распознавания речи)))
У меня не очень хорошо вышло. Было около 60к текстов на английском, делал два варианта: текст_с_ошибками -> правильный_ответ и наоборот. Хотя если взять модель и корпус побольше, то может и сработает.