Size: a a a

Natural Language Processing

2021 August 18

d

dePuff in Natural Language Processing
В лэйблах маст хэв EOS токен
источник

BS

Bogdan Salyp in Natural Language Processing
Так он там и есть, это </s>
источник

d

dePuff in Natural Language Processing
И в generate есть максимум длины, минимум и пенальти за длину

При обучении всё это не нужно
источник

BS

Bogdan Salyp in Natural Language Processing
Да, generate я умею настраивать
Мне надо было обучение починить)
источник

d

dePuff in Natural Language Processing
Max length в токенизаторах,  коллаторах и т.п., чтобы не обрезало случайно до смешного количества токенов
источник

d

dePuff in Natural Language Processing
Ну месяц экспериментов на V100 в 32гб и ты мастер 😅
источник

D

Dmitry in Natural Language Processing
спасибо попробую)
источник

d

dePuff in Natural Language Processing
Сразу скажу, что дефолтные параметры из  HF бесконечно далеки от счастья для тюнинга T5
источник

A

Anton in Natural Language Processing
Ваши рекомендации?
источник

BS

Bogdan Salyp in Natural Language Processing
По результатам мне пока что нравится больше всего beam_search с динамическим diversity_penalty в зависимости от длины текста
источник

BS

Bogdan Salyp in Natural Language Processing
На GPT лучше семплинга
Но на Т5 все может быть иначе
источник

d

dePuff in Natural Language Processing
Страдать 😭 Нормальной инфы околонуля по тюнингу
источник

BS

Bogdan Salyp in Natural Language Processing
А, сорри, это про обучение
Я подумал про генерацию
источник

d

dePuff in Natural Language Processing
Было такое наблюдение. Потом выяснилось, что если модельку кормить хорошими данными на обучении в хорошем объёме, то она выкрутится достаточно хорошо и с очень жёстким пенальти на генерации.

То есть хак с динамическим пенальти хорош, когда моделька недостаточно умная
источник

AW

Alex Wortega in Natural Language Processing
Поддерживаю
источник

A

Anton in Natural Language Processing
Печально )))
источник

A

Anton in Natural Language Processing
интересно можно заменить часть пайплайна моделью QA? Что думаете?
источник

D

Dany in Natural Language Processing
Переслано от Dany
****Freelancing Opportunity **

DATA SCIENTIST

Need atleast 4 yrs exp people with below skills :

Natural Language processing, c3.ai platform, AWS, tensor flow, git version, spacy, nltk

Project: competitive marketing pricing through natural language processing.

Intrested people DM
источник

DD

David Dale in Natural Language Processing
Добрый вечер! Хочу задать вопрос @forman и всем сочувствующим по библиотеке anyks-sc.
Вопрос такой: как потестировать эту библиотеку (в python), ничего не обучая самостоятельно?
Хочется получить минимальный работающий сниппет кода, а документация долгая и путанная
источник

ЮЛ

Юрий Лобарев... in Natural Language Processing
источник