Телеграмм чат группы natural_language_processing страница 868

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2186 membersпожаловаться на группу

2020 October 15

KS

Konstantin Smith in Natural Language Processing

Добрый вечер, подскажите, есть ли готовые решения для извлечения из текстов таких характеристик, как различные физические величины: размеры, сила тока, напряжение, давление, объём и т.п.?

Pullenti есть специальный анализатор именно для этой задачи

источник

10:09пожаловаться #1

OR

Oleg Radchenko in Natural Language Processing

здравствуйте. подскажите, сталкивались ли вы с решением проблемы анализа связности текста? я имею в виду отсеивание явной бессмыслицы. может быть есть какие-то простые решения для этого?

источник

10:19пожаловаться #2

К

Кикбан in Natural Language Processing

здравствуйте. подскажите, сталкивались ли вы с решением проблемы анализа связности текста? я имею в виду отсеивание явной бессмыслицы. может быть есть какие-то простые решения для этого?

статистику распределения символов или N-грамм считать

источник

10:21пожаловаться #3

OR

Oleg Radchenko in Natural Language Processing

Кикбан

статистику распределения символов или N-грамм считать

уточню задачу. имеется в виду не набор символов а набор слов не имеющий смысла

источник

10:24пожаловаться #4

К

Кикбан in Natural Language Processing

Ооо, Смысл :) "на чешуе жестяной рыбы прочёл я звуки новых губ"

источник

10:26пожаловаться #5

OR

Oleg Radchenko in Natural Language Processing

Кикбан

Ооо, Смысл :) "на чешуе жестяной рыбы прочёл я звуки новых губ"

ну не настолько глубоко )

источник

10:27пожаловаться #6

OR

Oleg Radchenko in Natural Language Processing

я скорее просто про отсечение наборов несвязанных слов. но я вас понял, кажется что это малореализуемо

источник

10:29пожаловаться #7

FF

Futorio Franklin in Natural Language Processing

я скорее просто про отсечение наборов несвязанных слов. но я вас понял, кажется что это малореализуемо

Собрать распределение частоты биграмм слов

источник

10:30пожаловаться #8

К

Кикбан in Natural Language Processing

я скорее просто про отсечение наборов несвязанных слов. но я вас понял, кажется что это малореализуемо

думаю, профессионалы смогут предложить что-то более интересное - я с этим не сталкивался.

источник

10:31пожаловаться #9

OR

Oleg Radchenko in Natural Language Processing

Futorio Franklin

Собрать распределение частоты биграмм слов

интересный вариант, спасибо

источник

10:31пожаловаться #10

К

Кикбан in Natural Language Processing

Futorio Franklin

Собрать распределение частоты биграмм слов

Google Words вроде раздавал биграммы и N-граммы слов

источник

10:31пожаловаться #11

К

Кикбан in Natural Language Processing

Только слова существенно более вариативны, чем N-граммы, имхо даже после диких стеммеров сможет отлавливать только достаточно длинные тексты с бессмыслицей

источник

10:33пожаловаться #12

FF

Futorio Franklin in Natural Language Processing

Кикбан

Google Words вроде раздавал биграммы и N-граммы слов

Тут мне кажется, что сильно от домена зависит

источник

10:33пожаловаться #13

FF

Futorio Franklin in Natural Language Processing

Распределение в литературе и какой-нибудь профессиональной сфере будут отличаться

источник

10:34пожаловаться #14

OR

Oleg Radchenko in Natural Language Processing

у нас разговорная речь (

источник

10:41пожаловаться #15

OR

Oleg Radchenko in Natural Language Processing

но правда домен-ориентированная

источник

10:42пожаловаться #16

К

Кикбан in Natural Language Processing

в режиме поиска быстрых универсальных решений - можно прогнать через лемматизатор и определение частей речи. Потом сравнить распределение частей речи с эталонным распределением, для поиска аномалий.

"Пять глаголов подряд - что-то здесь не так" :)

источник

10:50пожаловаться #17

OR

Oleg Radchenko in Natural Language Processing

Кикбан

в режиме поиска быстрых универсальных решений - можно прогнать через лемматизатор и определение частей речи. Потом сравнить распределение частей речи с эталонным распределением, для поиска аномалий.

"Пять глаголов подряд - что-то здесь не так" :)

да, звучит разумно, спасибо

источник

10:51пожаловаться #18

К

Кикбан in Natural Language Processing

Это если подняться с уровня символов на уровень частей речи

источник

10:51пожаловаться #19

VG

Valeriy Grebenyuk in Natural Language Processing

Как разместить вакансию здесь?

источник

12:00пожаловаться #20