Size: a a a

NLP_RU - Natural Language Processing & Text Mining

2019 June 26

1

1111 in NLP_RU - Natural Language Processing & Text Mining
ищу текстовый корпус в мессагах выше, и прям зачитался)) Пользуясь случаем, спрошу, возможно ли, допустим демона системд написать, для реализации т9 на десктопе , используя dmenu. Ну или как-нибудь иначе?
источник

1

1111 in NLP_RU - Natural Language Processing & Text Mining
Я извиняюсь, но чем открывать .bin файлы корпусов с RusVectores?
источник

t2

tonko 22 in NLP_RU - Natural Language Processing & Text Mining
1111
Я извиняюсь, но чем открывать .bin файлы корпусов с RusVectores?
gensim, там где-то инструкция была внизу, вроде
источник
2019 June 27

1

1111 in NLP_RU - Natural Language Processing & Text Mining
Обнаружил сейчас, что чтобы купить себе  домен .bot, надо верифицировать у Амазона своего бота: .BOT is an identity for bots. Currently, anyone who owns, operates or manages bots published using a supported tool (Amazon Lex, Botkit Studio, Dialogflow, Gupshup, Microsoft Bot Framework, and Pandorabots) can validate a bot and register a .BOT domain name. To ensure only eligible customers register a .BOT domain name, your bot will be validated prior to registration. The validation token is required to register your .BOT domain name. Что они подразумевают под ботом? Я хотел сайт-клавиатурный тренажер. Подскажите пожалуйста что читать, я вообще не в теме. Извините за тупняк.
источник
2019 July 23

NK

ID:665302391 in NLP_RU - Natural Language Processing & Text Mining
/
источник

D🐈

Dan 🐈 Capybara in NLP_RU - Natural Language Processing & Text Mining
ID:665302391
/
\
источник

NK

ID:665302391 in NLP_RU - Natural Language Processing & Text Mining
Men
источник
2019 August 07

SZ

Sasha Zhu in NLP_RU - Natural Language Processing & Text Mining
всем привет, кто работал с pytextrank, можете проконсультировать?
источник
2019 August 13

m

mel kaye in NLP_RU - Natural Language Processing & Text Mining
А есть ли смысл не нормализировать слова в bow?
источник

m

mel kaye in NLP_RU - Natural Language Processing & Text Mining
Допустим после нормализации получим (кошка, собака, за, бежать) из чего непонятно кто за кем бежал
источник
2019 August 14

BZ

Below Zero in NLP_RU - Natural Language Processing & Text Mining
mel kaye
Допустим после нормализации получим (кошка, собака, за, бежать) из чего непонятно кто за кем бежал
От задачи же зависит. Если вам важна последовательность слов, то bow в любом случае не подойдёт, с нормализацией и без
источник

m

mel kaye in NLP_RU - Natural Language Processing & Text Mining
Below Zero
От задачи же зависит. Если вам важна последовательность слов, то bow в любом случае не подойдёт, с нормализацией и без
это очевидно
источник

m

mel kaye in NLP_RU - Natural Language Processing & Text Mining
но я думал в духе что имея bow небольшого текста существует ограниченное количество осмысленных комбинаций которые можно составить из слов
источник

m

mel kaye in NLP_RU - Natural Language Processing & Text Mining
и если убирать нормализацию то это количество будет меньше
источник

BZ

Below Zero in NLP_RU - Natural Language Processing & Text Mining
mel kaye
и если убирать нормализацию то это количество будет меньше
проблема в том, как определять осмысленность
источник
2020 January 11

C

Combot in NLP_RU - Natural Language Processing & Text Mining
Sveta1 has been banned! Reason: CAS ban.
источник
2020 January 20

C

Combot in NLP_RU - Natural Language Processing & Text Mining
Echika Tewodros has been banned! Reason: CAS ban.
источник

C

Cucusenok in NLP_RU - Natural Language Processing & Text Mining
Всем добрейшего. Соответственно хочу решить задачу классификации текста.

Я знаю, что можно пулом занять текст, но я бы хотел сделать это так:

Я бы хотел разбить текст на более мелкие единицы, абзацы, предложения и присвоить их какому-то классу/вектору. В идеале, если я не смог сопоставить класс - необходимо его распознать. Соответственно я бы хотел сохранить эти результаты как классы/векторы и в задаче поиска текстов по классу искать по ним. Но это дороговато, поэтому в идеале было по этим же классам составить общий вектор, где эти классы будут параметрами для результирующего вектора всего текста.

Если вы знаете подобные реализации или в какую сторону копать - был бы очень благодарен.
источник
2020 February 01

А

А in NLP_RU - Natural Language Processing & Text Mining
Добрый день,  может быть кто-нибудь занимался анализом сентиментов для арабского? Возможно подскажете ресурсы доступные
источник
2020 February 11

AP

Alexandra Panina in NLP_RU - Natural Language Processing & Text Mining
Всем привет! Подскажите пожалуйста библиотеку для синтаксического анализа русского текста
источник