Size: a a a

Natural Language Processing

2021 July 30

DP

Defragmented Panda in Natural Language Processing
да, читал

длинные слова разбивает на группы букв
источник

E

Elena in Natural Language Processing
вы можете указать max length какой хотите, в пределах 512
источник

DP

Defragmented Panda in Natural Language Processing
я прааильно понимаю что это требует перетренировки всей модели?
источник

CT

Cookie Thief in Natural Language Processing
Если только на инференс, можно даже не падить
источник

E

Elena in Natural Language Processing
это делается в момент файнтюнинга, когда вы дообучаете модель на своем датасете
источник

DP

Defragmented Panda in Natural Language Processing
а что увидит модель там где вход кончился (предложение короткое), но входы модели натренированы?
источник

CT

Cookie Thief in Natural Language Processing
Ну если модель тренировалась на которких текстах, то на инференсе имеет смысл резать текста под максимальную длину, которую видела модель
источник

DP

Defragmented Panda in Natural Language Processing
мне интересно как оно работает внутри

какой тип нейронов у входов?
источник

CT

Cookie Thief in Natural Language Processing
Советую тогда почитать оригинальную статью про трансформеры, и блогпосты из серии The illustrated transformer, там в целом достаточно простое и подробное объяснение работы трансформеров.
Еще можно посмотреть всякие интересные визуализации аттеншена (https://github.com/jessevig/bertviz) и посмотреть на что модель обращает внимание
источник

GP

Grigoriy Polyanitsin in Natural Language Processing
спасибо!
источник

DD

Day Dreaming in Natural Language Processing
Кто-нибудь использовал в реальных задачах Polyanalyst? Интересны отзывы, за пределами регулярок он может что-нибудь сделать?
источник
2021 July 31

NS

Nikolay V. Shmyrev in Natural Language Processing
источник

B

Banof in Natural Language Processing
🔫 Sanah Sayyed кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@nshmyrev, @lissen2me, @tesemnikov, n i, @EvgenIvanov
При поддержке Золота Бородача
источник
2021 August 01

SS

Sergey Sikorskiy in Natural Language Processing
источник

B

Banof in Natural Language Processing
🔫 User кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@LoneGeek, @SaturnOleg, @ykvr2, @johnshoq, @couldbeanybody
При поддержке Золота Бородача
источник

VM

Victor Maslov in Natural Language Processing
вроде как победил
источник

VM

Victor Maslov in Natural Language Processing
на входе 50000 названий каналов
считается минут 5
https://dpaste.org/6LwV/slim
это топ 100 слов, которые выделились

наблюдаю только одну ошибку -- в 32 строке
потому что после "crypto" сильно часто идет буква "c": currency, coin, chat, com

(29 строка -- gruppasi -- это не ошибка, это по-турецки)
источник

AW

Alex Wortega in Natural Language Processing
Всем привет, кто то решал задачу рифмовки существующего текста?
источник

S

Sergey in Natural Language Processing
источник

B

Banof in Natural Language Processing
🔫 @benvarriano кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@Greyss, @Cene655, @arseniyplus, @nekrasov_anton, @nshmyrev
При поддержке Золота Бородача
источник