Size: a a a

Natural Language Processing

2021 February 14

BS

Bogdan Salyp in Natural Language Processing
Типо запрет на повторение n-грамм
источник

Д

Датасаенсяш... in Natural Language Processing
Спасибо!
источник

BS

Bogdan Salyp in Natural Language Processing
Ещё советую попробовать num_return_sequences, чтобы выбирать из N вариантов
источник

Д

Датасаенсяш... in Natural Language Processing
Оу, я попробовал с ними поиграться - начало появляться что-то осмысленное
источник

Д

Датасаенсяш... in Natural Language Processing
Спасибо еще раз =)
источник

BS

Bogdan Salyp in Natural Language Processing
Да не за что)
источник

SD

Sergey Dulikov in Natural Language Processing
обычно гпт при генерации используют не совсем так
источник

SD

Sergey Dulikov in Natural Language Processing
генерируют в цикле по одному токену новому
источник

SD

Sergey Dulikov in Natural Language Processing
причем выбирать токен на каждом этапе лучше стохастически по распределению, которое модель возвращает
источник

BS

Bogdan Salyp in Natural Language Processing
Так она так и работает
источник

SD

Sergey Dulikov in Natural Language Processing
чтобы разнообразие было
источник

BS

Bogdan Salyp in Natural Language Processing
Она генерирует по одному токену на основе предыдущего набора
источник

SD

Sergey Dulikov in Natural Language Processing
А, там метод generate так написан?
источник

BS

Bogdan Salyp in Natural Language Processing
Да
источник

BS

Bogdan Salyp in Natural Language Processing
Я исходный код изучал и редактировал
источник

SD

Sergey Dulikov in Natural Language Processing
Тогда, извиняюсь)
источник

BS

Bogdan Salyp in Natural Language Processing
Sergey Dulikov
причем выбирать токен на каждом этапе лучше стохастически по распределению, которое модель возвращает
Вот с этим распределением ещё можно играть с помощью temperature/top_k/top_p либо самому руками писать свои LogitПроцессоры
источник

SD

Sergey Dulikov in Natural Language Processing
Я руками генерацию писал просто
источник

SS

Sergey Shulga in Natural Language Processing
А я может пропустил, как с gpt3 снять эмбединг? Ну то есть подал на вход текст- на выход вектор этого текста. С какого слоя снимать?
источник

SS

Sergey Shulga in Natural Language Processing
И какой примерно размер последовательности за раз заходит?
источник