Size: a a a

Natural Language Processing

2021 January 28

D•

Dan • Captain in Natural Language Processing
Denis Izmaylov
Друзья, коллеги, а здесь можно обьявление о вакансии на проект опубликовать? 🙂 Или где можно? Проект на 1-2 месяца, NPL, NER, русский язык, вот это все.
Мне давай :) я в @datasciencejobs опубликую
источник

D•

Dan • Captain in Natural Language Processing
По блату поставлю на завтра :)
источник

A

Anton in Natural Language Processing
Alexandra Zh
а еще такой вопрос — в препроцессинге, конечно, убираются эмодзи. а есть ли что-то, что анализирует и их тоже? и, может быть, сарказм и иронию?

тут готовых решений не видела тоже
Саша, привет!
Посмотри вот эту сетку на hugging face https://huggingface.co/cardiffnlp/twitter-roberta-base-emoji
источник

AZ

Alexandra Zh in Natural Language Processing
О, привет :)
Спасибо большое!
источник

A

Anton in Natural Language Processing
такой выход - должно помочь
источник

AZ

Alexandra Zh in Natural Language Processing
найс, надо поиграться с комбинированием других моделей. спасибо!
источник
2021 January 29

С

Сергей in Natural Language Processing
Баирто
Есть какая нибудь библиотека на питоне конвертирующие текст в дату и время типа через час завтра в пятницу шестого числа
Попробуйте Dateparser https://dateparser.readthedocs.io/en/latest/
источник

Б

Баирто in Natural Language Processing
Сергей
Попробуйте Dateparser https://dateparser.readthedocs.io/en/latest/
о спасибо
источник

SP

Sebastian Pereira in Natural Language Processing
Привет! Коллеги, а кто-то может подсказать где взять коллекцию наиболее часто встречающихся  n-grams (trigram) для английского языка? Пока вижу только платные корпуса, вроде этого https://www.ngrams.info
источник

N

Natalia in Natural Language Processing
источник

TM

Toemik Mnemonic in Natural Language Processing
Кто нибудь знает, как обстоят дела в русской модели spacy с англицизмами? и как модель себя поведет при использовании метода similarity для англоязычного контекста в случае использования русскоязычной модели?
источник

TM

Toemik Mnemonic in Natural Language Processing
и в догонку чем отличается spacy от spacy-nightly?
источник

YB

Yuri Baburov in Natural Language Processing
Toemik Mnemonic
и в догонку чем отличается spacy от spacy-nightly?
nightly — это бета версия для spacy 3.0.
в nightly есть модели с трансформерами
источник

SS

Sergey Silyuk in Natural Language Processing
Кто-нибудь подскажет, какие есть решения для русского языка aspect based sentiment analysis?
источник

FF

Futorio Franklin in Natural Language Processing
Sergey Silyuk
Кто-нибудь подскажет, какие есть решения для русского языка aspect based sentiment analysis?
ABAE
источник

FF

Futorio Franklin in Natural Language Processing
Можно обычный KNN как бейзлайн
источник

FF

Futorio Franklin in Natural Language Processing
для выделения аспектов
источник

TM

Toemik Mnemonic in Natural Language Processing
Yuri Baburov
nightly — это бета версия для spacy 3.0.
в nightly есть модели с трансформерами
👍
источник

AL

Alexey Lemeshevski in Natural Language Processing
Ребята, взываю к силе коллективного разума :)
1) я давно занимаюсь парсингами ...и это переросло в умение собирать структурированные данные с неограниченного количества сайтов. Я научился писать алгоритмы для извлечения ценовых данных (и распознавать ценные данные из названий товаров) и построил небольшую инфраструктуру для обхода десятков и сотен тысяч сайтов. Хочу превратить это в небольшой бизнес. Как вы думаете, где, помимо сбора цен, это может быть нужно? ...новости, вакансии... вот какие ещё датасеты можно собирать, в которых есть потребность? :) Может нужно кому? :)

2) если кому-то интересно - давайте делать вместе. Мне нужно разработчик в пару :)
источник

AE

Anton Eryomin in Natural Language Processing
Штука-то это нужная, но ниша уже занята многими. Разные компашки закупают парсинг конкурентов или пишут их сами.
источник