Size: a a a

Natural Language Processing

2020 November 16

TM

Toemik Mnemonic in Natural Language Processing
Всем привет! модели русского языка для SpaCy достаточно для решения задачи классификации запроса к боту? Где то читал что недовольны поддержкой русского в SpaCy, но возможно у недовольных были более сложные и широкие задачи.
источник

YB

Yuri Baburov in Natural Language Processing
Toemik Mnemonic
Всем привет! модели русского языка для SpaCy достаточно для решения задачи классификации запроса к боту? Где то читал что недовольны поддержкой русского в SpaCy, но возможно у недовольных были более сложные и широкие задачи.
с классификацией запросов проблема в другом: там обычно очень мало тренировочных данных, и поэтому точность классификации низкая.
это не сильно будет зависеть от выбора spacy или чего-то ещё.
источник

TM

Toemik Mnemonic in Natural Language Processing
Yuri Baburov
с классификацией запросов проблема в другом: там обычно очень мало тренировочных данных, и поэтому точность классификации низкая.
это не сильно будет зависеть от выбора spacy или чего-то ещё.
тут немного примитивнее чем, наверное, вы подумали.  планируется классифицировать на основе семантической близости типо Левенштейна токенов запроса с "Эталоном"
источник

TM

Toemik Mnemonic in Natural Language Processing
думаете бедовый подход даже если учесть что классов не больше 10 а запросы не превышают длину одного простого предложения?
источник

YB

Yuri Baburov in Natural Language Processing
Toemik Mnemonic
тут немного примитивнее чем, наверное, вы подумали.  планируется классифицировать на основе семантической близости типо Левенштейна токенов запроса с "Эталоном"
то есть вам нужны вектора? в spacy-ru 2.3 есть вектора для слов. контекстуальные вектора тоже можно получить, но это немного сложнее.
источник

TM

Toemik Mnemonic in Natural Language Processing
Yuri Baburov
то есть вам нужны вектора? в spacy-ru 2.3 есть вектора для слов. контекстуальные вектора тоже можно получить, но это немного сложнее.
в виде метода объекта Token?
источник

NS

Nikolay V. Shmyrev in Natural Language Processing
Jack New
Добрый день! Посоветуйте пжлс хорошую библиотеку по аугментации текстов на русском. Спасиб.
Кстати, недавно было такое https://dyakonov.org/2020/11/09/text-augmentation/

без готового кода, но обзор хороший
источник

YB

Yuri Baburov in Natural Language Processing
Toemik Mnemonic
в виде метода объекта Token?
да. token.vector_norm должно работать. и similarity тоже.
источник

TM

Toemik Mnemonic in Natural Language Processing
Yuri Baburov
да. token.vector_norm должно работать. и similarity тоже.
👍
источник

YB

Yuri Baburov in Natural Language Processing
Yuri Baburov
да. token.vector_norm должно работать. и similarity тоже.
https://github.com/buriy/spacy-ru/releases/tag/v2.3_beta
попробуйте, скажете. там во всех 4 моделях вектора одинаковые.
источник

TM

Toemik Mnemonic in Natural Language Processing
спасибо
источник

TM

Toemik Mnemonic in Natural Language Processing
да выглядит хорошо, будем пробовать
источник

GB

G B ☑️ in Natural Language Processing
Звонили из Geekbrain, предлагали вот такой курс Факультет искусственного интеллекта
 135к рублей за 18 мес. ~$100/мес за 2 раза в неделю по 2 часа.
Нужно ваше мнение, стоит ли брать?
И если стоит, то есть ли у кого то знакомые в Geekbrain, чтоб дали хороший скидос?
источник

NS

Nick Shevrov in Natural Language Processing
Gerkbrains...
Факультет искусственного интеллекта...

Хочешь курсы:
- ШАД
- Ozon masters
- MADE Mail.ru
источник

GB

G B ☑️ in Natural Language Processing
Nick Shevrov
Gerkbrains...
Факультет искусственного интеллекта...

Хочешь курсы:
- ШАД
- Ozon masters
- MADE Mail.ru
Николай, ну что же ты раньше молчал 😉Круто, спасибо,прямо открыл Америку, серьёзно не знал всех этих мест.
источник

NS

Nick Shevrov in Natural Language Processing
Да не за что
источник

ТС

Тимофей Смирнов... in Natural Language Processing
только туда еще пройти надо
источник

YB

Yuri Baburov in Natural Language Processing
G B ☑️
Звонили из Geekbrain, предлагали вот такой курс Факультет искусственного интеллекта
 135к рублей за 18 мес. ~$100/мес за 2 раза в неделю по 2 часа.
Нужно ваше мнение, стоит ли брать?
И если стоит, то есть ли у кого то знакомые в Geekbrain, чтоб дали хороший скидос?
Курсы нынче -- очень прибыльное дело для их создателей. Но не факт, что для участников. Пробуйте...
источник

TM

Toemik Mnemonic in Natural Language Processing
G B ☑️
Звонили из Geekbrain, предлагали вот такой курс Факультет искусственного интеллекта
 135к рублей за 18 мес. ~$100/мес за 2 раза в неделю по 2 часа.
Нужно ваше мнение, стоит ли брать?
И если стоит, то есть ли у кого то знакомые в Geekbrain, чтоб дали хороший скидос?
в geekbrain говорят так себе уровент образования. из otus ну и конечно да ШАД но там отбор
источник

SD

Stephan De Spiegelei... in Natural Language Processing
Question to the group: does anybody know of any code that can generate all cases of Russian nouns? So basically the reverse of lemmatization: you give the code a noun in nominative singular; and the code returns all other grammatical cases of that noun
источник