Телеграмм чат группы natural_language_processing страница 1424

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

3198 membersпожаловаться на группу

2021 September 07

SK

Sergey Kamenshchikov in Natural Language Processing

Hi :) NLP startup is looking for co-founder with 2+ years experience in NLP/ML. MVP, Lean culture, great team and first customers. We enter accelerator in Porto with perspective of relocation. We look for someone with passion to text generation. Please send me personal message for more details :)

источник

21:10пожаловаться #1

A

Alexander in Natural Language Processing

Всем привет! Кто сталкивался что тематическое моделирование LatentDirichletAllocation из Sklearn скачет по точности от 50 до 90 по adjusted_rand_score на трех классах от запуска к запуска. Есть какие идеи что с этим делать, кроме random_seed) ?

источник

21:32пожаловаться #2

IP

Igor Panteleev in Natural Language Processing

Спасибо большое за инфу!

Мысль у меня получается такая:
При отсутствие хоть сколько-нибудь значительного размеченного датасета (хотя бы несколько тысяч примеров, но сотнях примерах же нейронки не обучаются?) написать решение на моделях, считай невозможно, а такого датасета нет. А так как при этом известно, что доменная область задачи имеет контролируемый естественный язык, то решение на правилах может работать отлично.

источник

22:14пожаловаться #3

Е

Егорка in Natural Language Processing

Да, это хорошая задача. Особенно с точки зрения практики, когда нужно её как можно скорее решить, а получить достаточный набор данных для моделей МО проблематично.
Я решал аналогичную задачу в своей работе, используя композиции базовых алгоритмов. Так что, если сделаете инструмент, то можем сравнить результаты.

источник

23:43пожаловаться #4

2021 September 08

A

A in Natural Language Processing

Книга по spacy. Может, кому пригодиться.

источник

04:19пожаловаться #5

A

A in Natural Language Processing

Переслано от A

Mastering_spaCy_An_end_to_end_practical_guide_to_implementi.pdf

источник

04:19пожаловаться #6

B

Banof in Natural Language Processing

🔫 @Pishghadam1 кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@wadimiusz, @olegdurandin, @Alf162, @YallenGusev, A, @danilamilo
При поддержке Золота Бородача

источник

08:51пожаловаться #7

AO

Alex Orgish in Natural Language Processing

Есть еще подход weak supervision - размечать данные на правилах, а потом обучать модели на таких разметках. Подробнее - snorkel.org, snorkel.ai

источник

10:04пожаловаться #8

AO

Alex Orgish in Natural Language Processing

Как минимум - так можно отладку делать для правил: создал правила, разметил данные, обучил модель, запустил модель и правила на тестовых данных и проверил различия. Дальше корректируем правила и опять запускаем все сначала.

источник

10:12пожаловаться #9

AF

Alexander Fedorenko in Natural Language Processing

Спасибо. Пригодится)

источник

10:18пожаловаться #10

OG

Olga Gonch in Natural Language Processing

Коллеги, добрый день! Встречал кто-нибудь открытые базы телефонных разговоров? Интересуют горячие линии, доставка и т.п.

источник

10:47пожаловаться #11

OG

Olga Gonch in Natural Language Processing

Использовать хочу для классификации текстов

источник

10:48пожаловаться #12

A

Andrey in Natural Language Processing

Всем привет. Еще одна задача, где хорошо зашел pipeline с rubert-tiny. Есть набор текстов по времени, с сотню наверное, и непрерывнозначащая величина, которая может быть выше текущего уровня или ниже (классификация).


X = sequence.reshape(-1, 312*history),

pipeline: TruncatedSVD(312) -> LogReg(class_weight="balanced")

показывает шкалящую аккуру на отложенном тесте, около 98%, при дисбалансе 20/80.

хз, конечно датасет роляет, но тоже про качество эмбеддингов. на tfidf acc train/test были ~ 87%.

источник

10:57пожаловаться #13

d

dePuff in Natural Language Processing

Предсказываем по новостям куда курс пойдёт?😅

источник

11:02пожаловаться #14

A

Andrey in Natural Language Processing

процесс социальный, но не денежный и не новости

источник

11:04пожаловаться #15

RI

Radmir Ibragimov in Natural Language Processing

https://iloveudemy.com/natural-language-processing-real-world-projects-in-python/

iLoveUdemy » Udemy Free Courses

Natural Language Processing Real-World Projects in Python » iLoveUdemy

Solve 3 real Business Problems. Build Robust AI, NLP models for Sentiment, Security & Stock News Domain

источник

11:20пожаловаться #16

RI

Radmir Ibragimov in Natural Language Processing

Бесплатный курс, 2 дня ещё бесплатно

источник

11:22пожаловаться #17

AC

Anton Cherepkov in Natural Language Processing

А почему вы на таком дисбалансе считаете акураси?

источник

11:27пожаловаться #18

A

Andrey in Natural Language Processing

есть конечно и другие метрики))

но в принципе и аккураси можно считать при дисбалансе.

источник

11:35пожаловаться #19

SS

Shivashis Swain in Natural Language Processing

Anyone good with NLP, I need little help in text data evaluation on language detection use case.

источник

13:00пожаловаться #20