Телеграмм чат группы natural_language_processing страница 983

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2294 membersпожаловаться на группу

2020 December 26

BS

Bogdan Salyp in Natural Language Processing

Krep Kospit

А такой вопрос: прочитал, что one-hot кодирование уже неактуально, т.к. есть во фреймворках Embedding - слои. И можно не заниматься созданием гигантских таблиц, а, скажем, пронумеровать все уникальные слова или символы. Это так?

Ну тк концептуально это немного разные вещи
One-hot encoding - это ортогональные друг другу вектора, то есть между закодированными таким образом районами "Soho", "Central park" и "Little Italy" нет никакой связи, так как это будут вектора [1,0,0],[0,1,0],[0,0,1]
В эмбеддинге это будут вектора, например, [0.1,0.2,0.8],[0.2,0.3,0.9] и [0.7,-0.5,0.3] и тут уже можно сказать, что Сохо ближе к центральному парку, чем маленькая Италия

источник

14:41пожаловаться #1

BS

Bogdan Salyp in Natural Language Processing

Точнее если совсем буквоедствовать, то не разные вещи, а one-hot encoding - это особый случай эмбеддинга, когда размерность вектора == количеству классов, вектора ортогональны друг другу, ну и бонусом много нулей в матрице

источник

14:42пожаловаться #2

DD

David Dale in Natural Language Processing

Ну тк концептуально это немного разные вещи
One-hot encoding - это ортогональные друг другу вектора, то есть между закодированными таким образом районами "Soho", "Central park" и "Little Italy" нет никакой связи, так как это будут вектора [1,0,0],[0,1,0],[0,0,1]
В эмбеддинге это будут вектора, например, [0.1,0.2,0.8],[0.2,0.3,0.9] и [0.7,-0.5,0.3] и тут уже можно сказать, что Сохо ближе к центральному парку, чем маленькая Италия

Эта разница сохраняется до первого полносвязного слоя.
Как только ты умножишь one-hot векторы на очередную матрицу весов, на выходе будут dense векторы. И они будут в точности эквивалентны эмбеддингам.
То есть one-hot encoder + линейный слой = label encoder + слой эмбеддингов

источник

14:44пожаловаться #3

BS

Bogdan Salyp in Natural Language Processing

Угу

источник

14:44пожаловаться #4

BS

Bogdan Salyp in Natural Language Processing

Сейчас, мне очень нравится вот эта статья

источник

14:44пожаловаться #5

FF

Futorio Franklin in Natural Language Processing

Эта разница сохраняется до первого полносвязного слоя.
Как только ты умножишь one-hot векторы на очередную матрицу весов, на выходе будут dense векторы. И они будут в точности эквивалентны эмбеддингам.
То есть one-hot encoder + линейный слой = label encoder + слой эмбеддингов

Ну тогда по сути этот линейный слой и есть матрица эмбеддингов

источник

14:45пожаловаться #6

BS

Bogdan Salyp in Natural Language Processing

http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/

источник

14:45пожаловаться #7

BS

Bogdan Salyp in Natural Language Processing

Вот тут прям нарисовано, как после одного слоя one-hot становится эмбеддингом

источник

14:45пожаловаться #8

DD

David Dale in Natural Language Processing

Futorio Franklin

Ну тогда по сути этот линейный слой и есть матрица эмбеддингов

Да, математически так и есть.
Вычислительно второй вариант эффективнее, т.к. мы не тратим ресурсы процессора на умножение на ноль, а просто выбираем нужную строку в матрице по номеру.

источник

14:47пожаловаться #9

A

Aragaer in Natural Language Processing

но просто и получается, что обученный embedding слой это перевод из one-hot кодирования в эмбеддинг. А "готовый словарь" это ровно то же самое

источник

14:51пожаловаться #10

BS

Bogdan Salyp in Natural Language Processing

Готовый словарь - это когда прогнал заранее через этот слой и сохранил, чтобы потом не считать

источник

14:52пожаловаться #11

A

Aragaer in Natural Language Processing

ну или искусственным образом подобрал эти вектора. Может на бумажке посчитал.

источник

15:16пожаловаться #12

BS

Bogdan Salyp in Natural Language Processing

Да

источник

15:16пожаловаться #13

ДС

Дмитрий Симаков... in Natural Language Processing

Эта разница сохраняется до первого полносвязного слоя.
Как только ты умножишь one-hot векторы на очередную матрицу весов, на выходе будут dense векторы. И они будут в точности эквивалентны эмбеддингам.
То есть one-hot encoder + линейный слой = label encoder + слой эмбеддингов

По опыту оно к сильно разным вещам сходится и эмбеддинг слой работает гораздо лучше. (Ну и есть нюансы с памятью).

Интересно было бы понять, почему.

источник

16:15пожаловаться #14

DD

David Dale in Natural Language Processing

Дмитрий Симаков

По опыту оно к сильно разным вещам сходится и эмбеддинг слой работает гораздо лучше. (Ну и есть нюансы с памятью).

Интересно было бы понять, почему.

Скорее всего, инициализация разная. Математика градиентного спуска точно не должна отличаться.

источник

18:11пожаловаться #15

DD

David Dale in Natural Language Processing

источник

18:11пожаловаться #16

B

Banof in Natural Language Processing

🔫 van der velde erna кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@cointegrated, @motonarola, @dzhkn42, Ilya Naumov, @wooferclaw
При поддержке Золота Бородача

источник

18:11пожаловаться #17

Б

Баирто in Natural Language Processing

кто нибудь знает модель spacy ru работает с библиотекой rasa

источник

18:39пожаловаться #18

YB

Yuri Baburov in Natural Language Processing

кто нибудь знает модель spacy ru работает с библиотекой rasa

Работает, люди пользуются.

источник

20:01пожаловаться #19

SP

Sebastian Pereira in Natural Language Processing

Работает, люди пользуются.

+

источник

20:13пожаловаться #20