Size: a a a

Natural Language Processing

2021 August 02

OR

Oleg Ruban in Natural Language Processing
всем привет) кто-то сталкивался с готовыми решениями для определения в тексте острых тем (религия, политика, расизм и т.п.)?
источник

AZ

Andrey Zakharov in Natural Language Processing
Была недавно целая работа на эту тему https://t.me/izolenta_mebiusa/170
источник

OR

Oleg Ruban in Natural Language Processing
о, спасибо, гляну)
источник

AS

Artem Snegirev in Natural Language Processing
Я правильно понимаю, что ограничение чекпоинтов Blenderbot в 128 токенов с HF, по смыслу такое же как у берта на 512 токенов? То есть я не могу расширить максимальную последовательность без переучивания

Моделька: https://huggingface.co/facebook/blenderbot-400M-distill/blob/main/config.json
Похожий вопрос: https://github.com/huggingface/transformers/issues/11868

В конфиге есть параметр max_position_embeddings, который я так понимаю задается перед трейном и не может быть изменен во время инференса, верно?
источник

SP

Surya Viswanath Pera... in Natural Language Processing
Hi everyone
источник

SP

Surya Viswanath Pera... in Natural Language Processing
I have few doubts in knowledge distillation, came here looking for help
источник

SK

Sergei Korolev in Natural Language Processing
источник

SP

Surya Viswanath Pera... in Natural Language Processing
sorry about that, I am currently learning about Knowledge distillation and I have a small confusion. Is knowledge distillation only applicable on softmax activation function?
источник

DD

David Dale in Natural Language Processing
Not only. You can apply similar mechanisms, for example, with linear activation (and MSE loss).
источник

d

dePuff in Natural Language Processing
При загрузке модели для интерференса его можно поменять чем то вроде
config = AutoConfig.from_pretrained('model_name', max_position_embeddings=xxx)

И отдачей этого конфига в код загрузки модели

С данной моделью не работал, но у меня был успех с моделью, которая училась на последовательность длиной X, а файнтюнилась на последовательноти длиной X/3

Перебил и заработало достаточно хорошо для моей задачи.


Про данный случай у меня сомнения, но проверить можно достаточно быстро
источник

B

Bruddah in Natural Language Processing
Всем привет, кто-нибудь работал над задачей извлечения названий юридических документов? Существуют ли какие-нибудь решения из коробки (yargy и тп)?
источник

AS

Artem Snegirev in Natural Language Processing
В оригинальной статье, прямо написано про ограничение в 128 токенов. Не знаю как это просмотрел :)

"Models were trained with maximum context and response lengths set to 128 BPE tokens, and longer examples were truncated."

Если ставить max_position_embeddings больше или меньше, то получаешь runtime error сразу:
https://github.com/huggingface/transformers/issues/11868
источник

IK

Ilya Kazakov in Natural Language Processing
@cointegrated, кажется, где-то видел твою статью про "тиничку".  не могу никак найти ссылку. можешь скинуть?
источник

d

dePuff in Natural Language Processing
источник

IK

Ilya Kazakov in Natural Language Processing
спасибо!!
источник

DD

David Dale in Natural Language Processing
Минутка занудства: слово tiny читается как "тайни"
источник

DD

David Dale in Natural Language Processing
источник

M

Maksym in Natural Language Processing
Как герой с Dota 2. Причём что в игре это великан))
источник

ДК

Дмитрий Крючков... in Natural Language Processing
Сначала то маленький
источник

D

Danila Milovanov in Natural Language Processing
А есть способ подружить эту модельку с tf? Пытался, не получалось.
источник