Телеграмм чат группы natural_language

С полгода назад пытались для задачи запустить... С одного репозитория под 3 питоном не хотело запускаться, с другого вроде запустилось но результаты немного странные выдавало

источник

14:58пожаловаться #10

Xenia Katasonova in Natural Language Processing

Anton A

Спасибо, вот тоже ничего не получается

источник

14:59пожаловаться #11

Anton A in Natural Language Processing

Xenia Katasonova

Спасибо, вот тоже ничего не получается

посмотрел - последний вариант (который технически запустился но результаты как-то не очень сходились) был с пакетом pylda2vec

источник

15:05пожаловаться #12

Alexander Kukushkin in Natural Language Processing

Технический доклад Олега Шляжко про то как именно СберДевайсы тренируют RuGPT3 https://youtu.be/GAWADIsBb0Y?t=5094

Выглядит разумным подход внимательно смотреть, что происходит в англоязычном NLP, адаптировать открытые результаты для русского. Архитектуры от OpenAI, фреймворк Microsoft DeepSpeed, Sparse Self-Attention как в OpenAI. Грубо говоря, мало кодить, с ресурсами меньше, чем у OpenAI получить результат как у OpenAI

- Снова расцвет мейнфреймов, вычисления дороже программистов
- https://youtu.be/GAWADIsBb0Y?t=5516 Путь от GPT2 Small до RuGPT3 XL https://huggingface.co/sberbank-ai/rugpt3xl
- Кристофари 200Гб Инфинибенд линки, почти линейный Data Parallel, работает пока модель оптимизатор и данные умещаются на одну GPU
- FP32 Adam 12 байт на вес, Mixed precision FP16 14 байт, Pure FP16 вроде у OpenAI непубличный 6 байт
- Мегабайты на батч, гигабайты на активации, V100 лимит ~2B весов для тренировки
- Megatron-LM, распределенное вычисление тензоров
- Microsoft ZERO, разложить состояние Adam по нескольким GPU
- Microsoft DeepSpeed, фреймворк с трюками выше
- DeepSpeed Offload, выгрузить часть в CPU RAM

YouTube

Семинар «Как съесть слона: обучение гигантских трансформерных моделей»

Нейросетевые трансформерные модели: GPT-3, ruGPT-3, T5/mT5, Switch Transformer, их обучение и использование. Особенности применения фреймворка Deep Speed. Тесты GLUE/SuperGLUE/Russian SuperGLUE. Создание систем машинного обучения/искусственного интеллекта на основе трансформерных моделей. Лекции Сергея Маркова, Татьяны Шавриной, Олега Шляжко, Александра Кукушкина.

00:00 Регламент, XL, Excel и ML
12:31 Сергей Марков, GPT-3 и другие гигантские трансформерные модели
1:24:58 Олег Шляжко, Optimizing Large-Scale GPT Model Pretraining
2:21:16 Татьяна Шаврина, Подходы к оценке и интерпретации результатов работы трансформерных моделей
3:01:14 Александр Кукушкин, MOROCCO — скорость и размер моделей Russian SuperGLUE

источник

16:06пожаловаться #13

Oleh Kutsenko in Natural Language Processing

Добрый день
Может кто подсказать возможно ли с помощью yargy (из natasha) сделать последовательное выделения, т.е. у меня есть ряд правил, предположим:
(name.interpretation(Inter.name), city.interpretation(Inter.city))
и текст: "Вася родился (много случайного текста) в городе Питер"
Есть ли какое то решение которое сможет сперва выделить тип "name" и после уже искать от найденного дальше при этом с возможностью записывать результат в одну сущность интерпретации?

источник

16:23пожаловаться #14

Alexander Kukushkin in Natural Language Processing

Oleh Kutsenko

Хорошего способа нет, есть рабочий немного костыльный, два раза запустить парсер, сначала выделить кусочки, собрать из них новый текст, запустить расер ещё раз https://nbviewer.jupyter.org/github/natasha/yargy/blob/master/docs/cookbook.ipynb#%D0%9F%D1%80%D0%BE%D0%BF%D1%83%D1%81%D1%82%D0%B8%D1%82%D1%8C-%D1%87%D0%B0%D1%81%D1%82%D1%8C-%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0

nbviewer.jupyter.org

Notebook on nbviewer

Check out this Jupyter notebook!

источник

16:35пожаловаться #15

Oleh Kutsenko in Natural Language Processing

но тогда интерпретацию нужно писать вручную?

источник

16:38пожаловаться #16

Alexander Kukushkin in Natural Language Processing

Не, почему, когда запускаешь парсер второй раз, интерпретация работает как обычно, получается одна сущность

источник

17:02пожаловаться #17

Valeriy Grebenyuk in Natural Language Processing

Поделитесь, пожалуйста, телеграм-каналами для размещения вакансий по NLP.

источник

18:32пожаловаться #18

Natalia in Natural Language Processing

кажется, тут когда-то кто-то про жанры спрашивал, тут вот в четверг будет семинар финский с докладчицей из Турку (один из основных NLP-центров Финляндии):
https://www.helsinki.fi/en/helsinki-centre-for-digital-humanities/digital-humanities-research-seminar-0

University of Helsinki

Digital Humanities Research Seminar | University of Helsinki

Digital humanities research seminar for those interested in DH

источник

19:00пожаловаться #19

2021 February 03

КМ

Крюков Максим... in Natural Language Processing

Подскажите с помощью чего можно найти семантическую близость в графе? Вершины графа название профессий.

источник

09:49пожаловаться #20