Size: a a a

Natural Language Processing

2021 February 21

AK

Alexander Kukushkin in Natural Language Processing
Переслано от David Dale
Привет всем! Я таки собрался провести мастер-класс по разработке навыков Алисы на python.
Он пройдёт в зуме 4 марта в 19.00, регистрация по ссылке.

За вечер мы попробуем научиться:
- Писать код навыков Алисы на языке Python и публиковать их;
- Удобно организовывать код сценария, когда веток становится много;
- Подключать свои инструменты анализа текста, если грамматик от Яндекса недостаточно.
- Хостить навыки на бесплатных или дешёвых мощностях;
- Настраивать аналитику, автотесты и continuous integration для навыка.

Вебинар будет полезен как для тех, кто только хочет начать писать навыки Алисы, и для тех, кто уже имеет такой опыт, но интересуется, как устроены решения коллег.

Обязательное требование: знакомство с Python.
Желательное требование: знакомство с идеей навыков Алисы и спецификой их разработки (стартовая страничка, документация, чат разработчиков).
источник
2021 February 22

A

Anton in Natural Language Processing
German Zvonchuk
Друзья,

Есть сотни новостей, нужно найти из них одинаковые и похожие новости.

Подскажите пожалуйста алгоритмы и технологии при помощи которых, это можно реализовать.
Universal sentence encoder
источник

VR

Vladimir R in Natural Language Processing
Anton
Universal sentence encoder
Как это работает, можете, пожалуйста, подробнее?
источник

KL

Kir L in Natural Language Processing
Vladimir R
Как это работает, можете, пожалуйста, подробнее?
https://tfhub.dev/google/universal-sentence-encoder-multilingual/3 тут есть примеры, это сссылка на многоязыковую модель
источник

DD

David Dale in Natural Language Processing
Vladimir R
Как это работает, можете, пожалуйста, подробнее?
Это нейросетка, которая в явном виде обучалась на кучу задач, требующих представления предложения в виде одного вектора.
Ещё есть хорошая laser в том же духе, там 93 языка, включая русский.
источник

VR

Vladimir R in Natural Language Processing
Ещё интересный (для меня) вопрос, я имею тексты, которые собраны вокруг определённой предметной области (допустим - с чётко выраженной лексикой: животноводство, инженерия, медицина и тд). Я хочу найти термины (понять что этот термин имеет отношение к данной области) и относительно этих терминов сделать тематическое моделирование (или что-то подобное). Я использовал BigARTM и LDA, но в целом я вижу, что либо это какие-то специфические механизмы или их нужно как-то хитро использовать для решения данного вопроса.
источник

VR

Vladimir R in Natural Language Processing
Kir L
https://tfhub.dev/google/universal-sentence-encoder-multilingual/3 тут есть примеры, это сссылка на многоязыковую модель
Огромное спасибо, таким образом можно делать кластеризацию, отлично!
источник

AK

Alexander Kukushkin in Natural Language Processing
В этом году на Диалоге особенно много интересных соревнований, ссылочки в одном месте:

- RuSimpleSentEval. Симплификация предложений. https://t.me/natural_language_processing/26351
- Кластеризация новостей, выбор залоговка. https://t.me/natural_language_processing/26362
- SemSketches. Наглядное представление о семантике слова. https://t.me/natural_language_processing/26461
- RuNormAS. Нормализация именованных сущностей. https://t.me/natural_language_processing/26441
источник

OS

Oleg Serikov in Natural Language Processing
Второй раз вы пишите дорожки, но не все. А почему? А то меня разделило между организацией одной запиленной и одной незапиненой
источник

OM

Oleg Mosalov in Natural Language Processing
Известно ли, когда будет информация о студенческой сесии в рамках Диалога?
источник

AK

Alexander Kukushkin in Natural Language Processing
Oleg Serikov
Второй раз вы пишите дорожки, но не все. А почему? А то меня разделило между организацией одной запиленной и одной незапиненой
RuShiftEval уже заканчивается через несколько дней, поздно писать. Low Resource ASR не совсем по теме чата
источник

VR

Vladimir R in Natural Language Processing
Alexander Kukushkin
В этом году на Диалоге особенно много интересных соревнований, ссылочки в одном месте:

- RuSimpleSentEval. Симплификация предложений. https://t.me/natural_language_processing/26351
- Кластеризация новостей, выбор залоговка. https://t.me/natural_language_processing/26362
- SemSketches. Наглядное представление о семантике слова. https://t.me/natural_language_processing/26461
- RuNormAS. Нормализация именованных сущностей. https://t.me/natural_language_processing/26441
Интересно, была ли попытка обработать информацию в этом чате подробным образом 😊
источник

N

Natalia in Natural Language Processing
Alexander Kukushkin
RuShiftEval уже заканчивается через несколько дней, поздно писать. Low Resource ASR не совсем по теме чата
почему low resource не по теме-то? :)
источник

N

Natalia in Natural Language Processing
недостаточно nlp?
источник

VF

Vadim Fomin in Natural Language Processing
я думаю, дело в распознавании речи, а не в ресурсах
источник

VF

Vadim Fomin in Natural Language Processing
типа этим в другом чате занимаются
источник

N

Natalia in Natural Language Processing
или в смысле что там не на  русский упор?
источник

N

Natalia in Natural Language Processing
просто тут же спокойно задают вопросы в т.ч. про задачи на английский
источник

N

Natalia in Natural Language Processing
давайте расширять горизонты!
источник

AK

Alexander Kukushkin in Natural Language Processing
На сколько понимаю лучше подходит например https://t.me/speech_recognition_ru
источник