Size: a a a

Natural Language Processing

2020 November 30

KK

Krep Kospit in Natural Language Processing
Alex Wortega
Там кажется все определения есть, но на английском
Спасибо, сохранил
источник

KK

Krep Kospit in Natural Language Processing
Toemik Mnemonic
Привет, а поделишься ссылкой на курс?)
источник

SM

Sasha Marova in Natural Language Processing
И я на нем, на 1/4 где-то.
источник

V

Vic in Natural Language Processing
Ребят, у кого есть опыт размещения моделей на инференс на GPU - есть ли глобально разница на какой гпу размещать модель - на tesla t4, RTX 2080ti, NVIDIA Quadro если памяти нужно ну скажем 11гб на модель? Эти все видеокарты есть у облачных провайдеров, но какую лучше выбрать, может какая-то из них более эффективна на инференсе, а друга на обучении?
источник

RS

Ruslan Sabirov in Natural Language Processing
Привет!
Может кто-то посоветовать туториал с кодом по файн-тьюнингу GPT? Меня интересует чуть полее сложный юзкейс, когда нужно не просто продолжить текст, а, например, сгенерировать по нему вопрос (question generation) или ответить на вопрос (question answering)
источник

V

Vic in Natural Language Processing
Ruslan Sabirov
Привет!
Может кто-то посоветовать туториал с кодом по файн-тьюнингу GPT? Меня интересует чуть полее сложный юзкейс, когда нужно не просто продолжить текст, а, например, сгенерировать по нему вопрос (question generation) или ответить на вопрос (question answering)
на huggingface видел модель t5 под генерацию вопроса
источник

OM

Orzhan Mikhail in Natural Language Processing
Ruslan Sabirov
Привет!
Может кто-то посоветовать туториал с кодом по файн-тьюнингу GPT? Меня интересует чуть полее сложный юзкейс, когда нужно не просто продолжить текст, а, например, сгенерировать по нему вопрос (question generation) или ответить на вопрос (question answering)
Можно добавить в обучающую выборку маркеры, разделяющие контекст и вопрос, вопрос и ответ. Потом подавать на вход контекст + маркер - будет генерация вопроса. Если подать контекст + маркер + вопрос + маркер - генерация ответа
источник

YB

Yuri Baburov in Natural Language Processing
Vic
Ребят, у кого есть опыт размещения моделей на инференс на GPU - есть ли глобально разница на какой гпу размещать модель - на tesla t4, RTX 2080ti, NVIDIA Quadro если памяти нужно ну скажем 11гб на модель? Эти все видеокарты есть у облачных провайдеров, но какую лучше выбрать, может какая-то из них более эффективна на инференсе, а друга на обучении?
Так арендуй каждую на час и померь. Задачи очень разные бывают, и fp16 может влиять
источник

M

Maxim in Natural Language Processing
Привет!
У меня 2 вопроса про yargy
1) Встроенный токенайзер отличается от razdel?
2) Правильно ли я понимаю, что в yargy можно прописывать грамматику фраз? Например, в форме: предлог (0 или 1) + прилагательное (0 или больше) + существительное (1)
источник
2020 December 01

MS

Marat Saidov in Natural Language Processing
А существуют ли токенайзеры, предназначенные специально для исходного кода? Работаю с Python150k: https://www.sri.inf.ethz.ch/py150
источник

AS

Alex Surname in Natural Language Processing
ну так если компилятор занимается токенизацией, то очевидно что да
источник

ИК

Илья Курьянов... in Natural Language Processing
import tokenize,  не?
источник

MS

Marat Saidov in Natural Language Processing
В коде ведь табуляция, много пунктуации и т.д. Хочется по-умному препроцессить
источник

MS

Marat Saidov in Natural Language Processing
Alex Surname
ну так если компилятор занимается токенизацией, то очевидно что да
Речь скорее про либу питоновскую
источник

FF

Futorio Franklin in Natural Language Processing
Marat Saidov
Речь скорее про либу питоновскую
В датасете используется ast модуль питона, если я правильно понял
источник

FF

Futorio Franklin in Natural Language Processing
соотвественно его и использовать для токенизации
источник
2020 December 02

OA

Oluwaseun Alagbe in Natural Language Processing
Good day Everybody, I have a little problem training my "Nlu data". I created this data which was saved in a "md" format. But when I try to train it, It brings out this error [Unknown data format]
источник

OA

Oluwaseun Alagbe in Natural Language Processing
источник

AK

Alexander Kukushkin in Natural Language Processing
Maxim
Привет!
У меня 2 вопроса про yargy
1) Встроенный токенайзер отличается от razdel?
2) Правильно ли я понимаю, что в yargy можно прописывать грамматику фраз? Например, в форме: предлог (0 или 1) + прилагательное (0 или больше) + существительное (1)
источник

M

Maxim in Natural Language Processing
Спасибо большое!
источник