Size: a a a

Natural Language Processing

2020 September 25

FF

Futorio Franklin in Natural Language Processing
Alex Wortega
А кроме лента ру есть ещё хорошие новости по РФ? Максимально непредызятые и +- без ярко выраженной авторской лексики?
https://github.com/natasha/corus внизу есть датасеты других изданий
источник

AK

Alexander Kukushkin in Natural Language Processing
источник

AE

Anton Eryomin in Natural Language Processing
Valentin Malykh
коллеги, мы все-таки делаем новый запуск нашего курса Natural Language Processing; курс в этот раз будет онлайн, занятия будут по Zoom; вести буду я, все материалы будут на английском, но сами занятия будут на русском; квизы и задания будут на Степике, приглашения на него разошлем всем, кто зарегистрируется в форме; первая лекция будет в 18:30 во вторник, 29 сентября; канал для общения по курсу будет ODS.ai #huawei_nlp_course

форма регистрации: https://forms.gle/EjLbmRjCyH6YEqNx8
Подскажи пожалуйста, а письмо после регистрации стоит ожидать? Или как понять что регистрация прошла успешно?
источник

A

Alexander in Natural Language Processing
Valentin Malykh
коллеги, мы все-таки делаем новый запуск нашего курса Natural Language Processing; курс в этот раз будет онлайн, занятия будут по Zoom; вести буду я, все материалы будут на английском, но сами занятия будут на русском; квизы и задания будут на Степике, приглашения на него разошлем всем, кто зарегистрируется в форме; первая лекция будет в 18:30 во вторник, 29 сентября; канал для общения по курсу будет ODS.ai #huawei_nlp_course

форма регистрации: https://forms.gle/EjLbmRjCyH6YEqNx8
А записи лекций будут доступны после?
источник

VM

Valentin Malykh in Natural Language Processing
Anton Eryomin
Подскажи пожалуйста, а письмо после регистрации стоит ожидать? Или как понять что регистрация прошла успешно?
подтверждения как такового не предусмотрено, но попробуем добавить на будущее, спасибо

где-то в понедельник разошлем приглашения, если вам не придет, напишите мне
источник

VM

Valentin Malykh in Natural Language Processing
Alexander
А записи лекций будут доступны после?
будут
источник

AE

Anton Eryomin in Natural Language Processing
Да, хорошо. Спасибо большое заранее!!!
источник

V

Vitaly in Natural Language Processing
Уии!
источник

DK

Dmitri Kapustin in Natural Language Processing
уже с 1999 года не студент, но послушал бы с удовольствием лекции по NLP (отправил заявку) 🙂 на Степике есть отличный курс «Введение в Data Science и машинное обучение» от Анатолия Карпова, очень хороший лектор
источник

ML

Michael L in Natural Language Processing
Ребята, а подскажите в каком направлении двигаться, что бы в куче текста распознавать и до 90% всякие ТОО, ОАО, ООО  и т.д., названия могут быть в кавычках
источник

VM

Valentin Malykh in Natural Language Processing
посмотрите библиотеку Natasha
источник

YB

Yuri Baburov in Natural Language Processing
Michael L
Ребята, а подскажите в каком направлении двигаться, что бы в куче текста распознавать и до 90% всякие ТОО, ОАО, ООО  и т.д., названия могут быть в кавычках
скажу кратко: всё плохо. придётся расчехлять нейронку, можно взять готовую spacy-ru или natasha slovnet , и то будет не очень хорошо.
источник

ML

Michael L in Natural Language Processing
Yuri Baburov
скажу кратко: всё плохо. придётся расчехлять нейронку, можно взять готовую spacy-ru или natasha slovnet , и то будет не очень хорошо.
natasha без обучения под мой формат текста не особо различает что к чему, и это кроме того, что работает в пару раз медленнее slovnet navec
источник

SZ

Sergey Zhuravlev in Natural Language Processing
Подскажите пожалуйста, у меня есть тренировочный датасет для классификации текста. Классов 5. Но датасет получается очень несбалансированным - в одном классе 2000 тыс строк, в другом 1500 а в третьем 400 например. Как обычно поступают в таких ситуациях? Не урезать же все до самого маленького?
источник

T

Timur in Natural Language Processing
гайс, привет
подскажите, пожалуйста, тулзу, которая может склонять слово (на русском) в указанный падеж
спасибо
источник

SZ

Sergey Zhuravlev in Natural Language Processing
Timur
гайс, привет
подскажите, пожалуйста, тулзу, которая может склонять слово (на русском) в указанный падеж
спасибо
pymorphy2
источник

YB

Yuri Baburov in Natural Language Processing
Timur
гайс, привет
подскажите, пожалуйста, тулзу, которая может склонять слово (на русском) в указанный падеж
спасибо
более конкретно, гугли pymorph2 inflect
источник

DK

Dmitri Kapustin in Natural Language Processing
Sergey Zhuravlev
Подскажите пожалуйста, у меня есть тренировочный датасет для классификации текста. Классов 5. Но датасет получается очень несбалансированным - в одном классе 2000 тыс строк, в другом 1500 а в третьем 400 например. Как обычно поступают в таких ситуациях? Не урезать же все до самого маленького?
можно посчитать веса классов class_weight  и добавить этот параметр при обучении
model.fit(X_train, Y_train, nb_epoch=5, batch_size=32, class_weight=class_weight)
источник

YB

Yuri Baburov in Natural Language Processing
Sergey Zhuravlev
Подскажите пожалуйста, у меня есть тренировочный датасет для классификации текста. Классов 5. Но датасет получается очень несбалансированным - в одном классе 2000 тыс строк, в другом 1500 а в третьем 400 например. Как обычно поступают в таких ситуациях? Не урезать же все до самого маленького?
апсемплинг или даунсэмплинг, как хотите
источник

T

Timur in Natural Language Processing
Спасибо 🙃
источник