Size: a a a

RL reading group

2019 May 15

AZ

Andrii Zadaianchuk in RL reading group
Artur Chakhvadze
В нейросетях вообще почти никогда не используют l2 регуляризацию сейчас
А что используют? В сетках не очень большого размера :) Можно какую-то статью / review по этому поводу?
источник

П

Пётр in RL reading group
Andrii Zadaianchuk
А что используют? В сетках не очень большого размера :) Можно какую-то статью / review по этому поводу?
Дропаут.
источник

П

Пётр in RL reading group
Если переобучается действительно.
источник

П

Пётр in RL reading group
Если ты учишь RL, это ещё осознать надо.
источник

П

Пётр in RL reading group
Может у тебя награда неправильно устроена.
источник

AC

Artur Chakhvadze in RL reading group
Andrii Zadaianchuk
А что используют? В сетках не очень большого размера :) Можно какую-то статью / review по этому поводу?
В теории или на практике?
источник

AC

Artur Chakhvadze in RL reading group
На практике используют дропаут
источник

AC

Artur Chakhvadze in RL reading group
+ аугментацию
источник

AC

Artur Chakhvadze in RL reading group
+ label smoothing
источник

AC

Artur Chakhvadze in RL reading group
+ доменно-специфичные йобы-бобы
источник

AC

Artur Chakhvadze in RL reading group
В теории 🅱️айесовские методы всякие
источник

VA

Vadim Andronov in RL reading group
Artur Chakhvadze
В нейросетях вообще почти никогда не используют l2 регуляризацию сейчас
weight decay не L2 рег?
источник

AC

Artur Chakhvadze in RL reading group
l2
источник

П

Пётр in RL reading group
А early stopping делают?
источник

VA

Vadim Andronov in RL reading group
И что прям таки не используют?
источник

П

Пётр in RL reading group
Пётр
А early stopping делают?
Он вообще аналогичен регуляризации в сетках или нет?
источник

AC

Artur Chakhvadze in RL reading group
Что значит аналогичен?
источник

AC

Artur Chakhvadze in RL reading group
early stopping еще, да
источник

AC

Artur Chakhvadze in RL reading group
Это один из видов регуляризации
источник

П

Пётр in RL reading group
Ну для линрега делать early stopping — это то же самое, что делать L2. Спрашиваю, верно ли это для сетей.
источник