Size: a a a

Natural Language Processing

2020 November 24

RM

Roman Milovanov in Natural Language Processing
Bogdan Salyp
данные размечены? и какое колво классов?
да там дохера было.
источник

BS

Bogdan Salyp in Natural Language Processing
Toemik Mnemonic
4-6 классов. Данные используемые для контроля размечены
я бы использовал BERT в таком случае
источник

BS

Bogdan Salyp in Natural Language Processing
источник

BS

Bogdan Salyp in Natural Language Processing
источник

TM

Toemik Mnemonic in Natural Language Processing
Bogdan Salyp
я бы использовал BERT в таком случае
спасибо, изучу. В плане подготовке контекста (это сообщение в чате) : исключению частей речи, и тд?
источник

BS

Bogdan Salyp in Natural Language Processing
bert хорош с текстом без какой-либо обработки
источник

BS

Bogdan Salyp in Natural Language Processing
https://huggingface.co/DeepPavlov вот русские берты предобученные
источник

TM

Toemik Mnemonic in Natural Language Processing
Bogdan Salyp
bert хорош с текстом без какой-либо обработки
ок, пойду изучать, спасибо
источник

GD

Gurushantha Doddaman... in Natural Language Processing
Friends anybody is having the access to GPT-3 API 🔑
источник

SM

Sasha Marova in Natural Language Processing
Eug
Всем привет!
Есть текст, слова в котором разбиты пробелами на группы букв ("мама мыла раму" => "ма м а м ы ла р аму").
Подскажите, пожалуйста, какие есть (могут быть) подходы решения задачи восстановления исходного текста.
А n- grams модель для русского можно,интересно?
источник
2020 November 25

AK

Alexander Kukushkin in Natural Language Processing
Переслано от Alexander C
🚀 Онлайн семинар по ML/DS от "SBERLOGA"  
⌚ Четверг 26 ноября 17.00 по Москве
👨‍🔬 Александр Абрамов (Сбер)  сделает доклад: "Опыт создания sentence bert."

Как использовать metric learning для улучшения качества представления фраз. Хаки и хинты по улучшению представлений: losses, data augmentation, multitask learning.

Доклад основан на работе докладчика и его коллег , описанной в статье:
https://m.habr.com/ru/company/sberdevices/blog/527576/

Ссылка на зум будет позже.

📝 Дополнительная информация в телеграм чате:  https://t.me/sberlogadataclub
источник

AC

Alexander C in Natural Language Processing
Alexander Kukushkin
Переслано от Alexander C
🚀 Онлайн семинар по ML/DS от "SBERLOGA"  
⌚ Четверг 26 ноября 17.00 по Москве
👨‍🔬 Александр Абрамов (Сбер)  сделает доклад: "Опыт создания sentence bert."

Как использовать metric learning для улучшения качества представления фраз. Хаки и хинты по улучшению представлений: losses, data augmentation, multitask learning.

Доклад основан на работе докладчика и его коллег , описанной в статье:
https://m.habr.com/ru/company/sberdevices/blog/527576/

Ссылка на зум будет позже.

📝 Дополнительная информация в телеграм чате:  https://t.me/sberlogadataclub
Коллеги ,ссылка на зум будет в одс в НЛП разделе и ли спросить у меня. Из-за атаки зумбомберов не очень хочется открытую ссылку кидать в тг. Скорее всего они парсят тг.
источник

TM

Toemik Mnemonic in Natural Language Processing
приветствую! Кто нибудь может подсказать в Spacy одни и те же векторы используются для метода similarity в случаях расчёта для объектов токенов и для объектов лексем?
источник

YB

Yuri Baburov in Natural Language Processing
Toemik Mnemonic
приветствую! Кто нибудь может подсказать в Spacy одни и те же векторы используются для метода similarity в случаях расчёта для объектов токенов и для объектов лексем?
Проще всего тебе посмотреть в сорцы, там ровно две строчки должно быть. Кажется, используются вектора, если они есть, и cnn embeddings (tok2vec) если векторов нет.
источник

N

Night in Natural Language Processing
can anyone suggest a replacement of multiple of try catch blocks in python?
источник

TM

Toemik Mnemonic in Natural Language Processing
Yuri Baburov
Проще всего тебе посмотреть в сорцы, там ровно две строчки должно быть. Кажется, используются вектора, если они есть, и cnn embeddings (tok2vec) если векторов нет.
Получается нет разницы искать близость токен/токен или лексема(токен.лемма_)/лексема(токен.лемма_) ?
источник

AW

Alex Wortega in Natural Language Processing
Товарищи, у кого нибудь есть датасет rusbase? Либо какие то сервисы чтобы нормально спарсить его
источник

AK

Aleksey Kudakov in Natural Language Processing
а не подскажите, есть ли какой-то готовый SaaS (желательно) продукт, который бы мог тематизировать вопросы?
источник

AK

Aleksey Kudakov in Natural Language Processing
есть список вопросов, нужно разбить их по темам
источник

НК

Николай Карпенко... in Natural Language Processing
Aleksey Kudakov
есть список вопросов, нужно разбить их по темам
сколько вопросов, сколько тем?
источник