Телеграмм чат группы natural_language

коллеги, мы все-таки делаем новый запуск нашего курса Natural Language Processing; курс в этот раз будет онлайн, занятия будут по Zoom; вести буду я, все материалы будут на английском, но сами занятия будут на русском; квизы и задания будут на Степике, приглашения на него разошлем всем, кто зарегистрируется в форме; первая лекция будет в 18:30 во вторник, 29 сентября; канал для общения по курсу будет ODS.ai #huawei_nlp_course

форма регистрации: https://forms.gle/EjLbmRjCyH6YEqNx8

Подскажи пожалуйста, а письмо после регистрации стоит ожидать? Или как понять что регистрация прошла успешно?

источник

17:56пожаловаться #3

A

Alexander in Natural Language Processing

Valentin Malykh

коллеги, мы все-таки делаем новый запуск нашего курса Natural Language Processing; курс в этот раз будет онлайн, занятия будут по Zoom; вести буду я, все материалы будут на английском, но сами занятия будут на русском; квизы и задания будут на Степике, приглашения на него разошлем всем, кто зарегистрируется в форме; первая лекция будет в 18:30 во вторник, 29 сентября; канал для общения по курсу будет ODS.ai #huawei_nlp_course

форма регистрации: https://forms.gle/EjLbmRjCyH6YEqNx8

А записи лекций будут доступны после?

источник

18:09пожаловаться #4

VM

Valentin Malykh in Natural Language Processing

Anton Eryomin

Подскажи пожалуйста, а письмо после регистрации стоит ожидать? Или как понять что регистрация прошла успешно?

подтверждения как такового не предусмотрено, но попробуем добавить на будущее, спасибо

где-то в понедельник разошлем приглашения, если вам не придет, напишите мне

источник

18:14пожаловаться #5

VM

Valentin Malykh in Natural Language Processing

Alexander

А записи лекций будут доступны после?

будут

источник

18:14пожаловаться #6

AE

Anton Eryomin in Natural Language Processing

Да, хорошо. Спасибо большое заранее!!!

источник

18:14пожаловаться #7

V

Vitaly in Natural Language Processing

Уии!

источник

18:14пожаловаться #8

DK

Dmitri Kapustin in Natural Language Processing

уже с 1999 года не студент, но послушал бы с удовольствием лекции по NLP (отправил заявку) 🙂 на Степике есть отличный курс «Введение в Data Science и машинное обучение» от Анатолия Карпова, очень хороший лектор

источник

18:52пожаловаться #9

ML

Michael L in Natural Language Processing

Ребята, а подскажите в каком направлении двигаться, что бы в куче текста распознавать и до 90% всякие ТОО, ОАО, ООО и т.д., названия могут быть в кавычках

источник

18:57пожаловаться #10

VM

Valentin Malykh in Natural Language Processing

посмотрите библиотеку Natasha

источник

18:57пожаловаться #11

YB

Yuri Baburov in Natural Language Processing

Michael L

Ребята, а подскажите в каком направлении двигаться, что бы в куче текста распознавать и до 90% всякие ТОО, ОАО, ООО и т.д., названия могут быть в кавычках

скажу кратко: всё плохо. придётся расчехлять нейронку, можно взять готовую spacy-ru или natasha slovnet , и то будет не очень хорошо.

источник

19:02пожаловаться #12

ML

Michael L in Natural Language Processing

Yuri Baburov

скажу кратко: всё плохо. придётся расчехлять нейронку, можно взять готовую spacy-ru или natasha slovnet , и то будет не очень хорошо.

natasha без обучения под мой формат текста не особо различает что к чему, и это кроме того, что работает в пару раз медленнее slovnet navec

источник

19:03пожаловаться #13

SZ

Sergey Zhuravlev in Natural Language Processing

Подскажите пожалуйста, у меня есть тренировочный датасет для классификации текста. Классов 5. Но датасет получается очень несбалансированным - в одном классе 2000 тыс строк, в другом 1500 а в третьем 400 например. Как обычно поступают в таких ситуациях? Не урезать же все до самого маленького?

источник

20:27пожаловаться #14

T

Timur in Natural Language Processing

гайс, привет
подскажите, пожалуйста, тулзу, которая может склонять слово (на русском) в указанный падеж
спасибо

источник

20:29пожаловаться #15

SZ

Sergey Zhuravlev in Natural Language Processing

Timur

гайс, привет
подскажите, пожалуйста, тулзу, которая может склонять слово (на русском) в указанный падеж
спасибо

pymorphy2

источник

20:30пожаловаться #16

YB

Yuri Baburov in Natural Language Processing

Timur

гайс, привет
подскажите, пожалуйста, тулзу, которая может склонять слово (на русском) в указанный падеж
спасибо

более конкретно, гугли pymorph2 inflect

источник

20:31пожаловаться #17

DK

Dmitri Kapustin in Natural Language Processing

Sergey Zhuravlev

Подскажите пожалуйста, у меня есть тренировочный датасет для классификации текста. Классов 5. Но датасет получается очень несбалансированным - в одном классе 2000 тыс строк, в другом 1500 а в третьем 400 например. Как обычно поступают в таких ситуациях? Не урезать же все до самого маленького?

можно посчитать веса классов class_weight и добавить этот параметр при обучении
model.fit(X_train, Y_train, nb_epoch=5, batch_size=32, class_weight=class_weight)

источник

20:32пожаловаться #18

YB

Yuri Baburov in Natural Language Processing

Sergey Zhuravlev

Подскажите пожалуйста, у меня есть тренировочный датасет для классификации текста. Классов 5. Но датасет получается очень несбалансированным - в одном классе 2000 тыс строк, в другом 1500 а в третьем 400 например. Как обычно поступают в таких ситуациях? Не урезать же все до самого маленького?

апсемплинг или даунсэмплинг, как хотите

источник

20:32пожаловаться #19

T

Timur in Natural Language Processing

Спасибо 🙃

источник

20:32пожаловаться #20