Size: a a a

Natural Language Processing

2021 January 28

AZ

Alexandra Zh in Natural Language Processing
у меня задача как раз с твитами ассоциирована
источник

AZ

Alexandra Zh in Natural Language Processing
а еще такой вопрос — в препроцессинге, конечно, убираются эмодзи. а есть ли что-то, что анализирует и их тоже? и, может быть, сарказм и иронию?

тут готовых решений не видела тоже
источник

ВГ

Вадим Гилемзянов... in Natural Language Processing
Yuri Baburov
вот посмотрите здесь https://colab.research.google.com/drive/1EY0eL8Dfj7EuvUyR0fhJ4OyutwW4IZhT?usp=sharing функцию
norm_chunk , она переводит фразу в именительный падеж.
там используется комбинация spacy + pymorphy для повышения качества работы по сравнению с просто pymorphy .
но, если у вас несколько noun_chunks в предложении, то нужно понимать, какой сегмент вам нужно исправлять.
для этого вам нужен синтаксический анализ (который там как раз и делается), а после него — как-то понять, какой именно сегмент нужно исправлять. вот эту логику поиска сегмента написать нужно будет вам (искать клаузу со словом "ты", потом взять глагол-родитель?).
Тут скорее так, у меня имеется некоторый алгоритм - который подбирает релевантный ответ из истории сообщений клиентов - Его нужно адаптировать под конкретного, а именно род взять -
У меня первое что на ум приходит - Находить NER-сущности, и вокруг, допустим, имени смотреть морфологические зависимости и все приводить в род в соответствии главной сущностью

Ответ из истории : Привет, Наташа ты уже посети(ЛА) наши курсы, как твоя курсовая работа - прош(ЛА) отбор?
Будет:  Привет, <NAME : род> ты уже (посетил -> род : NAME) наши курсы, как твоя курсовая работа - прош(ЛА) отбор?
источник

ВГ

Вадим Гилемзянов... in Natural Language Processing
А задача с зависимыми словами, вроде как уже решенная
источник

AZ

Alexandra Zh in Natural Language Processing
Вадим Гилемзянов
Тут скорее так, у меня имеется некоторый алгоритм - который подбирает релевантный ответ из истории сообщений клиентов - Его нужно адаптировать под конкретного, а именно род взять -
У меня первое что на ум приходит - Находить NER-сущности, и вокруг, допустим, имени смотреть морфологические зависимости и все приводить в род в соответствии главной сущностью

Ответ из истории : Привет, Наташа ты уже посети(ЛА) наши курсы, как твоя курсовая работа - прош(ЛА) отбор?
Будет:  Привет, <NAME : род> ты уже (посетил -> род : NAME) наши курсы, как твоя курсовая работа - прош(ЛА) отбор?
тут, мне кажется, надо через лексикографические деревья заходить
источник

SS

Sergey Shulga in Natural Language Processing
Мне кажется, здесь можно все решить даже без ner, надо только обойти дерево парсера зависимостей и все.
источник

SS

Sergey Shulga in Natural Language Processing
А парсер возьми от spacy или natasha, они хорошо работают
источник

ВГ

Вадим Гилемзянов... in Natural Language Processing
Спасибо, попробуем)
источник

N

Natalia in Natural Language Processing
Sergey Shulga
А что сейчас есть из открытого и свежего по переводу rus<>eng?
https://twitter.com/Nils_Reimers/status/1354408250968563715?s=19

тут вот ещё собрано разное
источник

Б

Баирто in Natural Language Processing
Есть какая нибудь библиотека на питоне конвертирующие текст в дату и время типа через час завтра в пятницу шестого числа
источник

SS

Sergey Shulga in Natural Language Processing
Баирто
Есть какая нибудь библиотека на питоне конвертирующие текст в дату и время типа через час завтра в пятницу шестого числа
Для английского есть daking от Фейсбук.
источник

SS

Sergey Shulga in Natural Language Processing
Правда, там не питон
источник

Б

Баирто in Natural Language Processing
На русском надо бы
источник

GF

Grigory Frantsuzov in Natural Language Processing
Баирто
Есть какая нибудь библиотека на питоне конвертирующие текст в дату и время типа через час завтра в пятницу шестого числа
есть https://github.com/DenisNP/Hors на c# . Очень хорошо работает
источник

SS

Sergey Shulga in Natural Language Processing
Всем надо)
источник

GF

Grigory Frantsuzov in Natural Language Processing
можно обернуть в микросервис
источник

SS

Sergey Shulga in Natural Language Processing
Ну или враппер написать
источник

SS

Sergey Shulga in Natural Language Processing
О, возьму в копилку. Осталось в питон запихнуть
источник

Eg

Elena gisly in Natural Language Processing
еще heideltime есть, но он на Java. Но вроде есть обертка какая-то...
https://github.com/amineabdaoui/python-heideltime
источник

DI

Denis Izmaylov in Natural Language Processing
Друзья, коллеги, а здесь можно обьявление о вакансии на проект опубликовать? 🙂 Или где можно? Проект на 1-2 месяца, NPL, NER, русский язык, вот это все.
источник