Телеграмм чат группы natural_language

По моим данным, они не такие уж и испорченные.
В этом блокноте я на 8 тасках сравнивал берты (без дообучения), на 5 для LaBSE оказались лучше CLS эмбеддинги, на 3 - mean.
Так что истина, похоже, в том, что более подходящий вариант нужно подбирать экспериментально)

источник

00:29пожаловаться #8

E E in Natural Language Processing

А макс пулинг Не пробовали в принципе? Или хуже всегда?

источник

00:29пожаловаться #9

E E in Natural Language Processing

Огонь.

источник

00:30пожаловаться #10

E E in Natural Language Processing

Но там все без файнтьюна?

источник

00:31пожаловаться #11

David Dale in Natural Language Processing

Да, всё без файнтюна.
Файнтюнить на все эти задачи я пока не пробовал, но моё предположение в том, что при достаточно долгом файнтюнинге результаты cls и mean примерно сравнялись бы.
Потому что, как ты правильно заметил, модель под ними лежит одна и та же, и ничего не мешает берту научиться в последнем слое то же самое усреднение проводить, складывая результаты в CLS токен.

источник

00:33пожаловаться #12

E E in Natural Language Processing

На трейне да, не мешает. Но генерализация может быть разная.

источник

00:36пожаловаться #13

E E in Natural Language Processing

Вот кстати несвязанный вопрос. Судя по всему при файтьюне все mlm дико переобучаются , полностью запоминают трейн. Наблюдал на разного размера трейне от 100 до 25 000 примеров. По классике надо бы бороться с этим - увеличивать дропауты хотя бы. Но вроде все забивают. Есть исследования на эту тему?

источник

00:39пожаловаться #14

E E in Natural Language Processing

Если что, я немного пробовал при файнтьюне Берта подбирать дропаут и wd - Не помогло. Но все же ощущение, что как-то это неправильно 100% train acc.

источник

00:41пожаловаться #15

Sergey Shulga in Natural Language Processing

@cointegrated а ты не оценивал оптимальную\предельную длину предложения или количество токенов для LaBSE-энкодера?

источник

16:06пожаловаться #16

2021 July 25

Dmitry Borisov in Natural Language Processing

@banofbot

источник

12:01пожаловаться #17

Banof in Natural Language Processing

🔫 @Hakeemraa кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@drum_forrest_drum, @Titrom, @etkee, @solprogram, @ajtkulov
При поддержке Золота Бородача

источник

12:01пожаловаться #18

Rodion Proskuryakov in Natural Language Processing

А что на тесте?

источник

13:22пожаловаться #19

Sergiy Horef in Natural Language Processing

Добрый день,
Скажите, может кто-то знает как получить доступ к gpt-3?
Или же только ждать пока примут заявку на официальном сайте?

источник

15:37пожаловаться #20