Size: a a a

Natural Language Processing

2021 August 12

B

Banof in Natural Language Processing
🔫 @Hasan9815 кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@toriningen, @wadimiusz, @eigrad, @binariodue, @uran235, @Cene655
При поддержке Золота Бородача
источник
2021 August 13

t

toriningen in Natural Language Processing
источник

B

Banof in Natural Language Processing
🔫 Turner Kwin кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@toriningen, @dimstream, @cypic, @LoneGeek, @ontoho
При поддержке Золота Бородача
источник

P

Prajwal in Natural Language Processing
Anybody here want to work on real projects?
I have 2 real nlp projects
And one time series project
you can put this on your resume
DM if interested
источник

M

Max in Natural Language Processing
Добрый вечер. Подскажите, пожалуйста, есть ли ner, которые хорошо определяют имена и улицы независимо от регистра?
Или не ner, может словари есть?
источник

IK

Ilya Kazakov in Natural Language Processing
Тебе на русском? По РФ?
источник

M

Max in Natural Language Processing
Да
Смотрел Natasha, pullenti,stanza
Начинают что-то выдавать только, если отдаю на вход текст в капслоке. Но и то не точно, если, например, слово "улица" рядом не стоит.
Nltk вроде неплохо с именами справляется (но ner  что-то не понял, как прикрутить, loc не исследовал)
Spacy - замучил с "can't find factory for "tok2vec" (вдруг кому знакома ошибка?)
источник

M

Max in Natural Language Processing
Посоветовали ещё поискать "словари", чтобы точно определять, но, кроме postal для адресов (который не устанавливается), ничего не нашел пока...
источник

IK

Ilya Kazakov in Natural Language Processing
...в общем, словари имён гуглибельны. С улицами -- есть КЛАДР (на вики посмотри, там и ссылка есть на источник). Поиск по словарям вариант тупой, но надёжный, если ты знаешь, что парсишь))
источник

IK

Ilya Kazakov in Natural Language Processing
Если нужно в неспецифическом тексте выделить, то готовых решений лучше, чем то, что ты уже упомянул, наверно, не будет.
источник

M

Max in Natural Language Processing
Понял, спасибо)
источник
2021 August 14

SS

Sergey Sikorskiy in Natural Language Processing
источник

B

Banof in Natural Language Processing
🔫 Chris Cooper кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@LoneGeek, @dzhkn42, @fl666m4nn, @toriningen, @gislygisly
При поддержке Золота Бородача
источник

M

Max in Natural Language Processing
А кто-нибудь знает библиотеку на питоне для автоматического исправления "и" на "й", если написано неправильно?
Например, "добрыи", надо исправить на "добрый"
источник

KL

Kir L in Natural Language Processing
По идее любой спеллчекер должен справиться
источник

M

Max in Natural Language Processing
Лишь бы лишнего не на изменял, если вдруг будут какие-то специализированные термины хд
Может есть что-то именно для й/и, добрыи прям глаза режет
источник

M

Max in Natural Language Processing
Или они не исправляют то, что не знакомо?
Я раньше не слышал, нашел пока только pyspellchecker
источник

Н

Никита in Natural Language Processing
Может попробовать pymorphy 2. Проверять там score слова, а потом заменять и на й. И если score значимо увеличиться - значит, правильно заменили
источник

KL

Kir L in Natural Language Processing
Ещё Яндекс спеллер, там API. Jamspell
источник

SK

Sergey Kamenshchikov in Natural Language Processing
Добрый день. Подскажите пожалуйста, какой либой лучше всего случайно сливающиеся слова разделять?
источник