Size: a a a

Natural Language Processing

2021 August 04

AL

Andrew Lays in Natural Language Processing
спасибо! сейчас посмотрю, что за зверь такой
источник

A

Anton in Natural Language Processing
Взять mt5 потестить надо
источник

O

Olga in Natural Language Processing
Здравствуйте! Я тут новенькая. Подписалась на канал, чтобы понять, нравится ли мне эта профессия. Могла бы я кому-нибудь из Вас лично задать пару вопросов, пожалуйста?
источник

🐙

🐙 in Natural Language Processing
Ребят, мне нужно по копусу найти сущности из базы данных (названия фирм, фиксированный список, могут быть в разговорном/исковерканом варианте). Как это нормально называется, а то я запутался в Entity Matching, Entity Linking, Entity Extraction, Named Entity Recognition ...
источник

AP

Anna Pshenichnikova in Natural Language Processing
Спасибо за идею! А если всё-таки использовать анализ синтаксических зависимостей, как его лучше проводить, чтобы он был универсальным и учитывал разные типы предложений?
источник

Е

Егорка in Natural Language Processing
Задавайте в чате. Здесь много компетентных людей.
источник

O

Olga in Natural Language Processing
Благодарю!

Мои вопросы. Я хотела бы знать:

1. Какие языки программирования востребованы?

2. Какие иностранные языки (кроме англ) востребованы?

3. Какие области лингвистики особенно важно знать?

4. Насколько эта работа подразумевает тесный контакт с коллективом или заказчиком? Много общения, интеракции на работе или нет?
источник

ЯЗ

Я — пехотинец Владим... in Natural Language Processing
1. С++, скала, го, питон.
2. Немецкий, китайский.
4. Можно особо не общаться.
источник

Е

Егорка in Natural Language Processing
1. Python
2. Востребованность языков в NLP = востребованности языков в целом. Я на практике работаю только с русским.
3. Лучше пусть лингвисты чата ответят.
4. Столько же, сколько и в разработке вообще.
источник

VP

Vladimir P in Natural Language Processing
К ответу на первый вопрос можно добавить SQL, хотя это и не совсем язык программирования
источник

E

Elena in Natural Language Processing
1. python в основном, если речь идет о машинном обучении и ресерче 2. не знаю, я не в России 3. из лингвистики нужно знать терминологию и основные понятия и концепты, всего понемногу 4. зависит от типа проекта, типа компании, типа сектора - ресерч или индустрия. Я в ресерче, например, у нас не так много общения с заказчиками (хотя это тоже есть), но зато надо выступать на конференциях, мастер-классы всякие проводить и так далее
источник

A

Alex in Natural Language Processing
Здравствуйте. Подскажите, пожалуйста, чем можно разбить документ на китайском на предложения? Есть ли какой то предобученный sentence tokenizer или библиотека для этого?
источник
2021 August 05

AF

Alexander Fedorenko in Natural Language Processing
посмотрите на библиотеку gensim.
Примеров в сети много.
И вы найдете примеры решения задачи -поиска похожих статей.
И еще, вы можете в той же библиотеке посмотреть примеры LSI индексации текстов, которая тоже может подойти для вашей задачи и показать хороший результат по семантическому поиску

UPD добавил ссылку))
https://radimrehurek.com/gensim/auto_examples/

2-я
https://github.com/84adam/python3-nlp
источник

O

Olga in Natural Language Processing
Ребята! Спасибо большое за Ваши ответы на мои вопросы!
источник

AK

Andrey Kolpakov in Natural Language Processing
Довольно много есть, но большинство с документацией на китайском. Наверное самый хороший от байду - BaiduLac.
Но, если задача просто разбить на предложения, самым простым вариантом, наверное, будет использовать SnowNLP.
источник

M

Maksym in Natural Language Processing
#jobs_Hr
Всем отличного дня.
Компания Metingest Digital, ищет NLP инженера в наш RnD департамент.

https://jobs.dou.ua/companies/metinvest-digital/vacancies/136294/ - здесь подробное описания вакансии.
Зарплатная вилка в районе 4000$, есть возможность удаленной работы, белая заработная плата и интересные бенефиты. Быстрые этапы прохождения интервью и оперативный фидбек. С удовольствием расскажу все детали в личке))
источник

A

Alex in Natural Language Processing
Спасибо. Просто большинство китайских библиотек почему то на слова разбиение делают, а на предложения нет
источник

IS

Ivan Stankov in Natural Language Processing
Друзья! Всем привет. Нужен совет: у меня есть набор комментариев с тегами вида «вкусная еда» и «хороший сервис» я бы хотел на их основе натренировать модель классификации. Главное неудобство в том, что отдельный комментарий может иметь сразу несколько тегов (на самом деле их там куда больше двух) есть у кого соображения, какие модельки/подходы использовать?

Пока я думаю тренировать по модели для каждого тега (выходит бинарная классификация да/нет) но это, наверняка, не лучший подход
источник

FF

Futorio Franklin in Natural Language Processing
Можно перевести данные теги в эмбеддинговое пространство, и использовать их как дополнительные фичи для классификатора
источник

AE

Arty Erokhin in Natural Language Processing
Погуглите по словам Multilabel classification
источник