Size: a a a

Natural Language Processing

2021 January 08

S

Sergey in Natural Language Processing
Anton Kolonin
Всем привет! Здесь есть кто использует или даже поддерживает http://sz.ru/parser/ ?
Я поддерживаю сервер
источник

AK

Anton Kolonin in Natural Language Processing
Sergey
Я поддерживаю сервер
Да, Сергей, мы с вами уже списались уже по email - спасибо! Сейчас сделали интересную работу по NL segmentation,  в данный момент делаем по NL generation. В рамках этого - кастомный LG parser на Java: https://github.com/aigents/aigents-java-nlp
Пока все для английского. Для русского нужен интересант, допилить поддержку морфологии.
Вопрос - в https://github.com/opencog/link-grammar/tree/master/data/ru словари самые свежие или у вас есть новее где-то?
источник

S

Sergey in Natural Language Processing
Anton Kolonin
Да, Сергей, мы с вами уже списались уже по email - спасибо! Сейчас сделали интересную работу по NL segmentation,  в данный момент делаем по NL generation. В рамках этого - кастомный LG parser на Java: https://github.com/aigents/aigents-java-nlp
Пока все для английского. Для русского нужен интересант, допилить поддержку морфологии.
Вопрос - в https://github.com/opencog/link-grammar/tree/master/data/ru словари самые свежие или у вас есть новее где-то?
У Linas самые свежие были. Думаю, это самая актуальная версия.
источник

N

Natalia in Natural Language Processing
источник

N

Natalia in Natural Language Processing
там про NER для славянских
источник

N

Natalia in Natural Language Processing
и тут же вопрос походя: задумывались ли NLP-разработчики о том, что в их системах разметки NER как-то нет места кличкам домашних (и не только домашних) животных, например?..
источник

SS

Sergey Silyuk in Natural Language Processing
Кто-нибудь сталкивался с проблемой сленга? И как решали ее?
Особенно для задачи сентимента
источник

🚲U

🚲 Oleh Kopyl UI/UX d... in Natural Language Processing
Alexander Kukushkin
Кто-нибудь знает автоматизированный способ борьбы с данным конкретным видом спама? Именно картинки про Илона маска раздающего крипту. Не хочется чтобы здесь остались только сообщения от banof
Second this.

Читать пиксели картики.

И если порядок пикселей на Х% похож с той картинкой, удалять ее.

Или нет?

Сомневаюсь что плотность пикселей может быть разной, нужно тестить
источник

N

Natalia in Natural Language Processing
Sergey Silyuk
Кто-нибудь сталкивался с проблемой сленга? И как решали ее?
Особенно для задачи сентимента
а что именно кажется камнем преткновения?
источник

SS

Sergey Silyuk in Natural Language Processing
Natalia
а что именно кажется камнем преткновения?
Нет размеченных данных.
А готовые решения не определяют тональность для сленговых слов
источник

BS

Bogdan Salyp in Natural Language Processing
А какие готовые решения использовались?
источник

N

Natalia in Natural Language Processing
Sergey Silyuk
Нет размеченных данных.
А готовые решения не определяют тональность для сленговых слов
а можно поподробнее, как не определяют и почему для слов? тональность же обычно скорее для предложений или кусков текста задача
источник

N

Natalia in Natural Language Processing
не все же решения должны быть с какими-то списками лексики, размеченной по типу тональности
источник

N

Natalia in Natural Language Processing
ну а так - хотя бы искать синонимы по большим векторным моделям, например
источник

N

Natalia in Natural Language Processing
потому что уж в интернет-корпусах сленг явно есть
источник

N

Natalia in Natural Language Processing
можно сходить на rusvectores попроверять каких-нб кандидатов
источник

N

Natalia in Natural Language Processing
что выдаёт в соседях
источник

N

Natalia in Natural Language Processing
может ли это помочь
источник

SS

Sergey Silyuk in Natural Language Processing
Bogdan Salyp
А какие готовые решения использовались?
Достоевский и ещё некоторые
источник

SS

Sergey Silyuk in Natural Language Processing
Natalia
а можно поподробнее, как не определяют и почему для слов? тональность же обычно скорее для предложений или кусков текста задача
Некоторые тексты очень короткие.
Работаю с отзывами на игровом форуме и там лексика узконаправленная.

Rusvectores подбирает плохо кандидатов
источник