Телеграмм чат группы natural_language

Кому интересно, сейчас будет трансляция выступления Ивана Ямщикова, будет рассказывать о статье на тему Text Style Transfer, приходите послушать

https://youtu.be/KK7VruLo9vg

YouTube

Summer Science Week Online - Іван Ямщиков - «Перенесення стилю в текстах природною мовою»

Тема доповіді: «Перенесення стилю в текстах природною мовою»

Доповідь буде присвячена алгоритмам перенесення стилю. Іван розбере постановку даного завдання, ряд сучасних архітектур, які з цим працюють, та розкаже, чи впливає якість уявлення семантичної інформації на загальну якість роботи таких систем.

Іван Ямщиков — пост-док в інституті Макса Планка (Лейпциг, Німеччина). Іван отримав PhD з прикладної математики в Бранденбурзькому Технічному університеті, працював шість років аналітиком даних в компанії Яндекс. Зараз Іван поєднує дослідницьку діяльність з роботою в компанії ABBYY. Іван - автор і ведучий науково-популярного подкасту «Проветримся!»

Проект літньої школи від НТСА - https://gb.kyivcity.gov.ua/projects/16/1380

источник

17:00пожаловаться #7

Vedika Parvez in Natural Language Processing

Привет!

источник

17:00пожаловаться #8

Vedika Parvez in Natural Language Processing

Anyone worked on text generation here?

источник

17:10пожаловаться #9

Vedika Parvez in Natural Language Processing

hey! вы работали с генерацией естественного языка?

источник

17:20пожаловаться #10

Grigory Frantsuzov in Natural Language Processing

Vedika Parvez

Anyone worked on text generation here?

Some of us did

источник

17:24пожаловаться #11

Grigory Frantsuzov in Natural Language Processing

What is your question?

источник

17:24пожаловаться #12

Vedika Parvez in Natural Language Processing

Thanks for your reply! I was wondering if Markov chain is the only way to go about it? It's the only one I'm aware of as of now

источник

17:25пожаловаться #13

Grigory Frantsuzov in Natural Language Processing

Vedika Parvez

Thanks for your reply! I was wondering if Markov chain is the only way to go about it? It's the only one I'm aware of as of now

No,. it is not. Markov chains are quite old approach. You probably should read about modern approaches, such as neural network language models
here are some links on text generation
LSTM https://machinelearningmastery.com/text-generation-lstm-recurrent-neural-networks-python-keras/
Transformers (
BERT https://arxiv.org/pdf/1902.04094.pdf ,
GPT-2 https://talktotransformer.com/ , https://minimaxir.com/2019/09/howto-gpt2/

Machine Learning Mastery

Text Generation With LSTM Recurrent Neural Networks in Python with Keras - Machine Learning Mastery

Recurrent neural networks can also be used as generative models.

This means that in addition to being used for predictive models (making predictions) they can learn the sequences of a problem and then generate entirely new plausible sequences for the problem domain.

Generative models like this are useful not only to study how well a model has learned a problem, but to

источник

17:31пожаловаться #14

Vedika Parvez in Natural Language Processing

Ah, thanks, Grigory!

источник

18:10пожаловаться #15

Defragmented Panda in Natural Language Processing

а расскажите мне, дорогие сочатовцы, есть ли какие-нибудь работы почитать про системы подобные нейронкам по классам решаемых задач, но построенные снизу вверх, от оптимизации вычислений в гпу?

т.е. какой-нибудь исследователь берет все операции гпу, сравнивает какие из них больше вычислений могут сделать для обработки видео или звука, и на их основе строит модель?

извращения типа битовых операций, множестве чисел в 1 переменной и прочие радости демосцены, но примененные для обработки видео или звука в стиле нейронок

источник

19:35пожаловаться #16

2020 August 21

AlexandrN in Natural Language Processing

Всем привет! Коллеги, решаю задачу классификации (коротких) текстовых сообщений. Количество классов ~ 1000. Задача сама по себе не сложная, но столкнулся с проблемой - изменения в методике классификации, которые проводились ранее.
Например, из класса А могли «выделить» класс В, или, наоборот, два класса А, В «схлопнуть» в один класс А и т. д. Данные ситуации приводят к существенному снижению точности классификатора.
Поделитесь, пожалуйста, своим опытом решения подобных проблем.

источник

11:13пожаловаться #17

Defragmented Panda in Natural Language Processing

AlexandrN

делать сеть в которой есть 2 слоя в конце:

предпоследний слой с 100 000 классов, явно больше чем когда-либо будет нужно

последний слой с 1000 классов. при обьединении или разделении класса достаточно перетренировать только последний слой, или даже отдельные нейроны, если границы остальных классов не задеты

предпоследний слой можно тренировать с функцией ошибки на основе ортогональности (независимости, отсутствии корреляции классов) и на основе равнозначимости (простой случай - дропаут, средний - штраф за веса близкие к 1, сложный - считать корреляцию активности каждого из классов с активностью классов последнего слоя)

источник

11:21пожаловаться #18

Aragaer in Natural Language Processing

классы это только последний слой. Промежуточный предпоследний можно вообще не трогать, если он уже натренирован

источник

11:23пожаловаться #19

Defragmented Panda in Natural Language Processing

хм, да, выводы предпоследнего слоя лучше просто нейронами называть. и да, он и нужен чтобы при изменениях в списке нужных классов пере-тренировать только последний слой (или даже отдельные нейроны в нем)

источник

11:27пожаловаться #20