Size: a a a

Natural Language Processing

2018 May 12

AK

Alexander Kukushkin in Natural Language Processing
В Рullenti.ru оказывается есть версия для Питона http://www.pullenti.ru/DownloadPage.aspx  . "С версии 3.7 сделана версия и на Python 3, для чего разработан специальный конвертор .NET в Python. " Кто-то пробовал? У меня пока не получается распаковать zip
источник
2018 May 14

NK

Nikolai Kruglikov in Natural Language Processing
Привет! Я тут пытаюсь для диплома сравнить несколько IR-методов для выбора ответной реплики в чатботах — тематическое моделирование, эмбеддинги и tf-idf. Можете потыкать в бота @tm_chatbot и поставить несколько оценок?
источник
2018 May 16

I

I Апрельский in Natural Language Processing
источник

I

I Апрельский in Natural Language Processing
источник

I

I Апрельский in Natural Language Processing
Многообещающе они
источник
2018 May 17

b

bard009 in Natural Language Processing
Здравcтвуйте, а можно вопрос? Вот у нас есть MoneyExtractor, а как нибудь по простому можно сделать свое правило, чтобы парсер находил только определенные связки, условно
залог 100 тыс руб?
источник

b

bard009 in Natural Language Processing
Кроме как копировать руками правило из natasha/grammars/money.py и добавлять туда нужные слова
источник

DV

Dima Veselov in Natural Language Processing
Привет, можно делать через импорты: from natasha.grammars.money import ...
источник

b

bard009 in Natural Language Processing
да, спасибо большое, помогло
источник

AK

Alexander Kukushkin in Natural Language Processing
Небольшой апдейт yargy:
1. Появилась возможность написать .repeatable(max=3) . В этом чате были вопросы как такое сделать
2. Порядок аргументов в or_ теперь может повлиять на результат, это нужно для работы с неоднозначными грамматиками
3. Можно указать CRF-теггер через Parser(..., tagger=CrfTagger(...))

Подробнее https://github.com/natasha/yargy/pull/50 . Пакет с этими правками ещё не собран, если есть какие-то замечания, можно написать
источник

AK

Alexander Kukushkin in Natural Language Processing
Запись доклада на Датафесте про Наташу https://www.youtube.com/watch?v=3Lxb-DqPtv4&t=300s . Слайды https://github.com/natasha/natasha-talks/blob/master/2018-04-28_datafest5.pdf
источник

V

Vital in Natural Language Processing
Всем доброго дня! Подскажите пожалуйста, как правильно заставить интерпретировать такие ФИО, как "Айдаров Сергей Валентинович" ?
источник

V

Vital in Natural Language Processing
Сейчас получается вот так:
источник

V

Vital in Natural Language Processing
[{'first': 'сергей', 'middle': 'валентинович'}, {'first': 'айдар'}]
источник

I

I Апрельский in Natural Language Processing
Удалить Айдар из словаря имен?))
источник

I

I Апрельский in Natural Language Processing
Подумал, что нет Айдаров в словаре фамилий, но есть
источник

NT

Nick Turusin in Natural Language Processing
Alexander Kukushkin
Небольшой апдейт yargy:
1. Появилась возможность написать .repeatable(max=3) . В этом чате были вопросы как такое сделать
2. Порядок аргументов в or_ теперь может повлиять на результат, это нужно для работы с неоднозначными грамматиками
3. Можно указать CRF-теггер через Parser(..., tagger=CrfTagger(...))

Подробнее https://github.com/natasha/yargy/pull/50 . Пакет с этими правками ещё не собран, если есть какие-то замечания, можно написать
это вин, ребят. А какие в дальнейшем улучшения будут пилиться? Есть роадмап посмотреть? :)
источник

V

Vital in Natural Language Processing
I Апрельский
Подумал, что нет Айдаров в словаре фамилий, но есть
а я вот не вижу Айдаров в last.txt
источник

I

I Апрельский in Natural Language Processing
Vital
а я вот не вижу Айдаров в last.txt
источник

I

I Апрельский in Natural Language Processing
А так
источник