
Так вот, обнаружилось, что если выбрать редкостный язык, например сомалийский или маори, и написать в поле перевода всякую чушь, вроде слова dog 20 раз, переводчик от Google начинает бредить религиозными фразами про имя Господа и пришестие Иисуса. Представители Google по сути не ответили на запрос журналистов: "Это не баг, а фича - вводите чушь на перевод, получаете чушь". Но откуда тогда религиозные мотивы?
Интересную версию предложили специалисты по машинному обучению: для перевода с редкостных языков нейросетевому переводчику просто не хватает массива переводов для обучения. А вот Библия - это текст, который перевели на все языки мира, от сомалийского до гаитянского. Потому нейросеть выкручивается как может - выдаёт куски фраз, на которых её обучали. Что-то подобное вы могли видеть, когда нейросеть DeepDream обучили распознавать собак, а потом переключили в режим генерирования - и она начала дорисовывать песьи морды на всё, что ей показывали.
Нейросети, галлюцинирующие религиозными пророчествами - о таком ли будущем мы мечтали? 🤔
Что почитать по теме:
— Хороший текст о слабости нейросетевого перевода
— Разработчик Яндекса рассказывает о проблемах машинного перевода
— Как Яндекс помогает лингвистам сохранить редкие и исчезающие языки
— Как Google Translate перевели на новый уровень с помощью нейросетей
— Большой текст с историей машинного перевода