Телеграмм чат группы natural_language_processing страница 1050

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2416 membersпожаловаться на группу

2021 February 06

A

Anton in Natural Language Processing

http://www.dialog-21.ru/evaluation/
здесь пока что есть только 4 из 6 , обычно в феврале все начинаются, т.к. в начале марта уже сдавать задачи...

По кластеризации новостей я уточнил у Ильи Гусева, он сообщил что пока рано. Видимо что-то не готово.

источник

22:10пожаловаться #1

2021 February 07

d

dimakarp1996 in Natural Language Processing

Какой русский опенсорсный text to speech вы считаете самым лучшим?

источник

09:23пожаловаться #2

AK

Alexander Kukushkin in Natural Language Processing

На семинаре по байесовским методам в ML Катя Лобачёва рассказывает про BERT. Традиционный формат для академии: докладчик прочитал кучу статей, отобрал важное, логично пересказал. Трансформер, ELMO, GPT, BERT, что там происходит внутри, контекстуальность эмбеддингов, головы атеншена, трюки из RoBERTa, XLNet, ALBERT, ERNIE, ELECTRA.

Не очень глубоко, зато полно и на русском. Интересен взгляд из другой области, балдеют от количества статей вокруг BERT, объёма ресурсов.

https://www.youtube.com/watch?v=JO-RJRCkLvM
https://www.youtube.com/watch?v=5o8gTP-7xwg

BERT: Model, Analysis and Modifications, part 1 [in Russian]

Slides: https://github.com/bayesgroup/bayesgroup.github.io/blob/master/bmml_sem/2020/Lobacheva_BERT.pdf

Chat: https://drive.google.com/file/d/11M53onuSTm0GDQRZ54ccAEP1StZ_YSiw/view?usp=sharing

В современном NLP при решении многих задач используются контекстуальные эмбеддинги, предобученные на большом объеме неразмеченных данных. В данном докладе мы поговорим о том, что такое контекстуальные эмбеддинги, и обсудим подробно наиболее базовую и часто используемую модель - BERT. Мы посмотрим на некоторые варианты анализа того, что происходит внутри этой модели, а также познакомимся с ее более поздними модификациями: RoBERTa, ALBERT и другими.

источник

14:27пожаловаться #3

А

Алмаз in Natural Language Processing

Переслано от Алмаз

Здарова ребята, хотел спросить кое что, задали таск в универе никак не могу понять что нужно найти, Natural Language Processing - название курса, можете хотя бы объяснить что нужно найти, если знаете?)

источник

20:08пожаловаться #4

А

Алмаз in Natural Language Processing

Переслано от Алмаз

Такая тема еще есть)

источник

20:08пожаловаться #5

ЯЗ

Я — пехотинец Владим... in Natural Language Processing

Там же написано, что нужно сделать

источник

20:53пожаловаться #6

ЯЗ

Я — пехотинец Владим... in Natural Language Processing

Нужно найти вероятность, что вместо нужного слова пользователь напишет другое. Вероятности в текстовых файлах

источник

20:55пожаловаться #7

2021 February 08

NS

Nikolay V. Shmyrev in Natural Language Processing

Какой русский опенсорсный text to speech вы считаете самым лучшим?

Из того, что более-менее натренировано https://habr.com/ru/company/ashmanov_net/blog/528296/

но там технологии отстают от современных, лучше самому натренировать более современную сеть.

и gpu для синтеза надо, медленно

Open Source синтез речи SOVA

Всем привет! Ранее мы выкладывали статью про наше распознавание речи, сегодня мы хотим рассказать вам о нашем опыте по созданию синтеза речи на русском языке, а...

источник

02:57пожаловаться #8

BS

Bogdan Salyp in Natural Language Processing

Сейчас работал над определением схожести предложений, использовал диппавлов и Сбербанковский сберт
Делал косинусное расстояние между либо пуллингом, либо усредненным last state
И что-то сберовская модель странно себя показывает)

источник

09:34пожаловаться #9

BS

Bogdan Salyp in Natural Language Processing

источник

09:34пожаловаться #10

BS

Bogdan Salyp in Natural Language Processing

(никакого хейта в сторону Яндекса, рандомное предложение)

источник

09:34пожаловаться #11

BS

Bogdan Salyp in Natural Language Processing

Может я что-то не так делаю? Или проблемы модели

источник

09:34пожаловаться #12

BS

Bogdan Salyp in Natural Language Processing

Обычное усреднение либо пуллинг

источник

09:38пожаловаться #13

d

dePuff in Natural Language Processing

Может я что-то не так делаю? Или проблемы модели

Заюзай модель которую тренировали на семантическую близость

источник

09:39пожаловаться #14

DD

David Dale in Natural Language Processing

Может я что-то не так делаю? Или проблемы модели

А что именно тебе не нравится?
Любая модель, основанная на дистрибутивной семантике (что word2vec, что BERT) соотносит и синонимы, и антонимы с очень похожими векторами, т.к. они часто встречаются в одних и тех же контекстах.

источник

09:40пожаловаться #15

BS

Bogdan Salyp in Natural Language Processing

Хм, я думал у них одна модель, вот эта https://huggingface.co/sberbank-ai/sbert_large_nlu_ru
А где найти конкретные дообученные? На их гитхабе нет таких

sberbank-ai/sbert_large_nlu_ru · Hugging Face

We’re on a journey to solve and democratize artificial intelligence through natural language.

источник

09:41пожаловаться #16

BS

Bogdan Salyp in Natural Language Processing

А что именно тебе не нравится?
Любая модель, основанная на дистрибутивной семантике (что word2vec, что BERT) соотносит и синонимы, и антонимы с очень похожими векторами, т.к. они часто встречаются в одних и тех же контекстах.

Да, но это SBERT, которые по идее должны такое ловить

источник

09:42пожаловаться #17

DD

David Dale in Natural Language Processing

Возможно, для различения антонимов нужна модель, обученная на перевод, перефразирование, или другой сигнал, в явном виде подчёркивающий семантические различия.
Если нужны эмбеддинги предложений, я рекомендую USE или Laser (обе мультиязычные и есть русский)

источник

09:42пожаловаться #18

BS

Bogdan Salyp in Natural Language Processing

Хм, не пробовал USE на русском, спасибо, чекну)

источник

09:42пожаловаться #19

SP

Sebastian Pereira in Natural Language Processing

Хм, я думал у них одна модель, вот эта https://huggingface.co/sberbank-ai/sbert_large_nlu_ru
А где найти конкретные дообученные? На их гитхабе нет таких

sberbank-ai/sbert_large_nlu_ru · Hugging Face

We’re on a journey to solve and democratize artificial intelligence through natural language.

Мне кажется, что сам инструмент косинусный близости не походит для нормальной проверки семантического сходства.

источник

09:42пожаловаться #20