Телеграмм чат группы natural_language_processing страница 817

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1993 membersпожаловаться на группу

2020 September 02

IR

Ilkin Ramazanov in Natural Language Processing

SVM или если хочется нейросетей то простой MLP

Я читал в инете что naive bayes лучше всего подходит. Но на деле оказалось он полный тормоз

источник

18:11пожаловаться #1

AS

Alex Surname in Natural Language Processing

Ilkin Ramazanov

Я читал в инете что naive bayes лучше всего подходит. Но на деле оказалось он полный тормоз

ну так на каком этапе тормоза?

источник

18:12пожаловаться #2

E

Elena in Natural Language Processing

Ilkin Ramazanov

Скорость применения

а вообще возьми Sklearn и попробуй все модели для классификации с измерением времени тренировки и времени классификации, и сравни

источник

18:12пожаловаться #3

AS

Alex Surname in Natural Language Processing

там самое тяжело это сегментирование слов

источник

18:12пожаловаться #4

IR

Ilkin Ramazanov in Natural Language Processing

ну так на каком этапе тормоза?

Обучение

источник

18:12пожаловаться #5

AS

Alex Surname in Natural Language Processing

по ходу для всех вариантов что тут предлагается

источник

18:12пожаловаться #6

AS

Alex Surname in Natural Language Processing

нужно сегментировать слова

источник

18:12пожаловаться #7

AS

Alex Surname in Natural Language Processing

Ilkin Ramazanov

Обучение

профилировать обучение нужно

источник

18:12пожаловаться #8

E

Elena in Natural Language Processing

Ilkin Ramazanov

Я читал в инете что naive bayes лучше всего подходит. Но на деле оказалось он полный тормоз

нет, наив байес очень простой для текста, его можно за бейслайн взять

источник

18:12пожаловаться #9

AS

Alex Surname in Natural Language Processing

Ilkin Ramazanov

Обучение

там кроме сегментирования слов нет тяжелых вычислений

источник

18:13пожаловаться #10

IR

Ilkin Ramazanov in Natural Language Processing

Ясненько. Спс за помощь:)) попробую немного с данными поиграться

источник

18:14пожаловаться #11

IR

Ilkin Ramazanov in Natural Language Processing

Наверное проблема в них

источник

18:14пожаловаться #12

E

Elena in Natural Language Processing

Ilkin Ramazanov

Я читал в инете что naive bayes лучше всего подходит. Но на деле оказалось он полный тормоз

предобработка с нормализацией текста + TF-IDF векторизация + SVM нормальный вариант для текста. Еще можно попробовать FastText и их модель собственную для классификации

источник

18:15пожаловаться #13

SP

Sebastian Pereira in Natural Language Processing

Привет! Друзья, а какой у нас есть датасет для выражения согласия/несогласия, для русского языка. Самый глупый классификатор обучить.

источник

18:15пожаловаться #14

DD

David Dale in Natural Language Processing

Ilkin Ramazanov

Ребят какие модели лучше всего подходят для классификации текста? Важна скорость

Код для питонячьего sklearn: make_pipeline(CountVectorizer(), LogisticRegression()). Иногда этот бейзлайн сложно большими нейронками по качеству побить)

источник

18:15пожаловаться #15

AS

Alex Surname in Natural Language Processing

предобработка с нормализацией текста + TF-IDF векторизация + SVM нормальный вариант для текста. Еще можно попробовать FastText и их модель собственную для классификации

нет, оверхед после сегментирования слов больше чем для БАйеса, мы же скорость рассматриваем

источник

18:16пожаловаться #16

E

Elena in Natural Language Processing

да, я согласна про скорость, но и качество заметно лучше

источник

18:16пожаловаться #17

IR

Ilkin Ramazanov in Natural Language Processing

предобработка с нормализацией текста + TF-IDF векторизация + SVM нормальный вариант для текста. Еще можно попробовать FastText и их модель собственную для классификации

я почти также делал только использовал bag of words instead of td-idf

источник

18:16пожаловаться #18

E

Elena in Natural Language Processing

в простых моделях в итоге самый долгий этап - это обработка текста

источник

18:17пожаловаться #19

IR

Ilkin Ramazanov in Natural Language Processing

А как вообще понять что лучше юзать bag of words or tf idf?

источник

18:17пожаловаться #20