Size: a a a

Natural Language Processing

2021 July 07

IG

Ilya Gusev in Natural Language Processing
Ну в смысле, там же фиксированный словарь. Просто берём его, берём токены из текста, вычитываем одно из другого. И не так их уж дофига в bpe-то словаре.
источник

AW

Alex Wortega in Natural Language Processing
Хм, мейк сенс
источник

AW

Alex Wortega in Natural Language Processing
Благодарю
источник

IG

Ilya Gusev in Natural Language Processing
только это вряд ли будет работать, если уж хочется экстрактивной суммаризации, лучше её сразу и делать
источник

IG

Ilya Gusev in Natural Language Processing
и для этих же целей можно просто do_sample выключить и на beam-search переключиться
источник

AW

Alex Wortega in Natural Language Processing
Ну можно просто Берт обучить
источник

AW

Alex Wortega in Natural Language Processing
Но это не интересно
источник

d

dePuff in Natural Language Processing
Пересказ пяти предложений делать?
источник

A

Anton in Natural Language Processing
Мне кажется данных маловато, или эпох обучения. Я тот же mT5 дообучивал по рецептам от Ильи - всё офигенно суммаризует.
источник

d

dePuff in Natural Language Processing
Рецепты от Ильи?
источник

AW

Alex Wortega in Natural Language Processing
Данных 500мб на трейне
источник

A

Anton in Natural Language Processing
Был правда один зашквар... На вход было что-то - Студенты откуда-то, устроили тусовку там то, ну что-то в этом духе...
На выходе - Яхууууу! 😂😂😂
источник

A

Anton in Natural Language Processing
У @YallenGusev в репозиторий целый пул инфы про суммаризацию.
источник

d

dePuff in Natural Language Processing
Ок
источник

AW

Alex Wortega in Natural Language Processing
Ну там 700 токенов
источник

AW

Alex Wortega in Natural Language Processing
А можно пожалуйста линк
источник

d

dePuff in Natural Language Processing
источник

AW

Alex Wortega in Natural Language Processing
Благодарю
источник

d

dePuff in Natural Language Processing
Я согласен с моделью
источник

d

dePuff in Natural Language Processing
Мы же так кусочки слов запретим, не?
источник