Size: a a a

Natural Language Processing

2020 November 28

OR

Oleg Radchenko in Natural Language Processing
круто, посмотрим, спасибо
источник

SancheZz Мов in Natural Language Processing
Советую его дополнить большим числом антонимов и синонимов при помощи морф анализаторов
источник

SancheZz Мов in Natural Language Processing
Или ручками;)
источник

DD

David Dale in Natural Language Processing
Oleg Radchenko
коллеги, всем привет.
есть задача парафразирования (создания набора вариаций на основе одной фразы), подскажите какие решения существуют для русского, английского и других языков?
заранее большое спасибо!
Я делал такое вот поделие, работающее для примерно любого языка, но выдающее довольно кривые фразы, пригодные разве что для аугментации обучающей выборки.
Я там кручу и прореживаю синтаксические деревья, и заменяю слова на похожие по эмбеддингам.
Синтаксические парсеры и вордтувеки можно подставлять любые.
https://github.com/avidale/dependency-paraphraser
источник

SancheZz Мов in Natural Language Processing
David Dale
Я делал такое вот поделие, работающее для примерно любого языка, но выдающее довольно кривые фразы, пригодные разве что для аугментации обучающей выборки.
Я там кручу и прореживаю синтаксические деревья, и заменяю слова на похожие по эмбеддингам.
Синтаксические парсеры и вордтувеки можно подставлять любые.
https://github.com/avidale/dependency-paraphraser
Спасибо, Давид
источник

DD

David Dale in Natural Language Processing
Oleg Radchenko
коллеги, всем привет.
есть задача парафразирования (создания набора вариаций на основе одной фразы), подскажите какие решения существуют для русского, английского и других языков?
заранее большое спасибо!
Ну и ещё есть дефолтное приличное решение - гонять фразы через переводчик туда-обратно)
источник

SancheZz Мов in Natural Language Processing
Я тоже в закладочку возьму)
источник

SancheZz Мов in Natural Language Processing
David Dale
Ну и ещё есть дефолтное приличное решение - гонять фразы через переводчик туда-обратно)
Ну бывает тоже криво
источник

SancheZz Мов in Natural Language Processing
От  переводчика зависит
источник

SancheZz Мов in Natural Language Processing
Но согласен
источник

SancheZz Мов in Natural Language Processing
Чет забыл об этом
источник

OR

Oleg Radchenko in Natural Language Processing
David Dale
Я делал такое вот поделие, работающее для примерно любого языка, но выдающее довольно кривые фразы, пригодные разве что для аугментации обучающей выборки.
Я там кручу и прореживаю синтаксические деревья, и заменяю слова на похожие по эмбеддингам.
Синтаксические парсеры и вордтувеки можно подставлять любые.
https://github.com/avidale/dependency-paraphraser
Давид, спасибо! ну в общем нам для аугментации выборки и нужно в первую очередь )
источник

SancheZz Мов in Natural Language Processing
Oleg Radchenko
Давид, спасибо! ну в общем нам для аугментации выборки и нужно в первую очередь )
Добавляйте тогда еще простые ошибки
источник

SancheZz Мов in Natural Language Processing
Составьте частотный словарь типовых ошибок и опечаток на нграммах
источник

DD

David Dale in Natural Language Processing
Oleg Radchenko
Давид, спасибо! ну в общем нам для аугментации выборки и нужно в первую очередь )
Если подход покажется приемлемым, буду рад, если дашь фидбек и скажешь, как бы ещё хотелось дополнить)
источник

SM

Sasha Marova in Natural Language Processing
Николай Карпенко
В natasha делаю print(doc.sents)

UnicodeEncodeError: 'latin-1' codec can't encode characters in position 25-29: ordinal not in range(256)
А на системе какая кодировка? import sys import locale print( sys.getfilesystemencoding(), lacale.getpreferredencoding()), и тогда настроить, ну или в try except обернуть,может,так как- нить
источник

OR

Oleg Radchenko in Natural Language Processing
David Dale
Если подход покажется приемлемым, буду рад, если дашь фидбек и скажешь, как бы ещё хотелось дополнить)
договорились
источник

SM

Sasha Marova in Natural Language Processing
David Dale
Ну и ещё есть дефолтное приличное решение - гонять фразы через переводчик туда-обратно)
Ахах остроумно
источник

SancheZz Мов in Natural Language Processing
Sasha Marova
Ахах остроумно
Это старая тема с каггла)
источник

SancheZz Мов in Natural Language Processing
Еще Паша Остяков писал о ней
источник