Size: a a a

Natural Language Processing

2020 November 28

OR

Oleg Radchenko in Natural Language Processing
ну она кажется очевидной довольно )
источник

SancheZz Мов in Natural Language Processing
Но все упирается в качество переводчика
источник

SancheZz Мов in Natural Language Processing
Платное апи всегда качественнее
источник

SancheZz Мов in Natural Language Processing
У Я покрайне мере
источник

OR

Oleg Radchenko in Natural Language Processing
SancheZz Мов
Платное апи всегда качественнее
я не против заплатить
источник

SancheZz Мов in Natural Language Processing
Супер
источник

SancheZz Мов in Natural Language Processing
Мы переводили nli
источник

SancheZz Мов in Natural Language Processing
Яндексом
источник

SancheZz Мов in Natural Language Processing
На ру
источник

SancheZz Мов in Natural Language Processing
Платно
источник

SancheZz Мов in Natural Language Processing
Качество норм
источник

DD

David Dale in Natural Language Processing
Oleg Radchenko
коллеги, всем привет.
есть задача парафразирования (создания набора вариаций на основе одной фразы), подскажите какие решения существуют для русского, английского и других языков?
заранее большое спасибо!
Для английского на huggingface ещё есть неплохие seq2seqи для перефразирования - потюненные T5.
Такого же русского или мультиязычного я пока не видел, но раз уж мультиязычный T5 выложили, то рано или поздно они должны тоже появиться.
источник

AK

Alexander Kukushkin in Natural Language Processing
https://dyakonov.org/2020/11/09/text-augmentation/ про аугментации для русского
источник

OR

Oleg Radchenko in Natural Language Processing
Александр, спасибо!
источник

SancheZz Мов in Natural Language Processing
Есть еще text fooler
источник

SancheZz Мов in Natural Language Processing
Он атакует тексты
источник

SancheZz Мов in Natural Language Processing
Заменяя слова на близкие по написанию склонению и тп но меняющие смысл и крашащую метрику качества модели
источник

SancheZz Мов in Natural Language Processing
Полезно для хард негатив примеров
источник

SP

Sebastian Pereira in Natural Language Processing
David Dale
Я делал такое вот поделие, работающее для примерно любого языка, но выдающее довольно кривые фразы, пригодные разве что для аугментации обучающей выборки.
Я там кручу и прореживаю синтаксические деревья, и заменяю слова на похожие по эмбеддингам.
Синтаксические парсеры и вордтувеки можно подставлять любые.
https://github.com/avidale/dependency-paraphraser
Огонь, а я только собрался писать.
источник

OR

Oleg Radchenko in Natural Language Processing
SancheZz Мов
Есть еще text fooler
о, шикарно, такое тоже надо
источник