Size: a a a

Natural Language Processing

2021 July 23

SancheZz Мов in Natural Language Processing
Имхо
источник

SancheZz Мов in Natural Language Processing
+ как у cls токена копится сентенс инфа?)
источник

SancheZz Мов in Natural Language Processing
Как вы это понимаете
источник

SancheZz Мов in Natural Language Processing
?
источник

SancheZz Мов in Natural Language Processing
Я читал, что cls видит эмбеддинги окружения как обычно в аттеншн процедуре token* softmax(cls*token), далее сумма этого по всем взаимодействиям cls и токены окружения
источник

SancheZz Мов in Natural Language Processing
Получается такое вот "предложение "
источник

SancheZz Мов in Natural Language Processing
Но если взять сумму токенов из аттенш которые каждый с каждым так взаимодействуют и сумма уже полноконтекстных  их представлений, разница видна
источник
2021 July 24

SancheZz Мов in Natural Language Processing
источник

SancheZz Мов in Natural Language Processing
И тут об этом
источник

SancheZz Мов in Natural Language Processing
источник

SancheZz Мов in Natural Language Processing
Тип эмбеддинг cls токена считается ток с аттешн относительно него
источник

SancheZz Мов in Natural Language Processing
Остальные токены посчитаются со всеми и уже эти полноконтекстные вектора со всеми усреднят это mean pool
источник

EE

E E in Natural Language Processing
Нее,  в MLM таске смотрят на все. Чтобы избегать лика - замена на mask токен
источник

SancheZz Мов in Natural Language Processing
Ок
источник

SancheZz Мов in Natural Language Processing
Но ризон cls меньше инфы выше
источник

EE

E E in Natural Language Processing
А по-моему наоборот ничему не научимся.  Потому что предсказания должны от позиции зависеть. А среднее арифметическое оно на всех позициях одно.
источник

SancheZz Мов in Natural Language Processing
Естественно с учетом позов
источник

SancheZz Мов in Natural Language Processing
Мы не забываем что эмбеддинги на вход в блок это суперпозиция ток эмбеддинга и поз эмбеддинга
источник

SancheZz Мов in Natural Language Processing
Это я оставил за скобками итак жеж понятно
источник

EE

E E in Natural Language Processing
Ладно,  сорри, я про лабсе пока не осилил. Только Берт, Роберту и ХЛНет пока прочитал.
источник