Телеграмм чат группы natural_language

Все привет, может кто-нибудь думал на тем как ускорить yargy? У меня получаются очень большие грамматики которые работают приличное время (30 секунд и более), я это использую для генерации ответов в своём чат боте и получается непростительно долго

Но результат ответа меня полностью устраивает

Может кто-то пробовал прикрутить cyton или еще какие-нибудь варианты?

источник

11:00пожаловаться #7

SK

Sergei Korolev in Natural Language Processing

Ребят, всем привет!
Подскажите, есть ли библиотека / алгоритм для разделения русских слов по корням?

Например:
Электромонтаж = электро и монтаж (электричество / электрический даже лучше)

источник

12:02пожаловаться #8

YB

Yuri Baburov in Natural Language Processing

Igor Panteleev

Все привет, может кто-нибудь думал на тем как ускорить yargy? У меня получаются очень большие грамматики которые работают приличное время (30 секунд и более), я это использую для генерации ответов в своём чат боте и получается непростительно долго

Но результат ответа меня полностью устраивает

Может кто-то пробовал прикрутить cyton или еще какие-нибудь варианты?

Просто делаешь сетку на сгенерированном датасете.

источник

12:39пожаловаться #9

MK

Max Kuznetsov in Natural Language Processing

Igor Panteleev

Все привет, может кто-нибудь думал на тем как ускорить yargy? У меня получаются очень большие грамматики которые работают приличное время (30 секунд и более), я это использую для генерации ответов в своём чат боте и получается непростительно долго

Но результат ответа меня полностью устраивает

Может кто-то пробовал прикрутить cyton или еще какие-нибудь варианты?

Я начинаю думать. Переписать на c, go и т.п., но надо начинать с pymorphy

источник

12:42пожаловаться #10

YB

Yuri Baburov in Natural Language Processing

Max Kuznetsov

Я начинаю думать. Переписать на c, go и т.п., но надо начинать с pymorphy

Вместо pymorphy можно статическую базу использовать. Ну будет она весить 300 мб вместо 10 мб... По современным меркам -- пустяк.

источник

12:50пожаловаться #11

AK

Alexander Kukushkin in Natural Language Processing

Igor Panteleev

Все привет, может кто-нибудь думал на тем как ускорить yargy? У меня получаются очень большие грамматики которые работают приличное время (30 секунд и более), я это использую для генерации ответов в своём чат боте и получается непростительно долго

Но результат ответа меня полностью устраивает

Может кто-то пробовал прикрутить cyton или еще какие-нибудь варианты?

Пробовали запускать с Pypy?

источник

12:50пожаловаться #12

IK

Ilya Kazakov in Natural Language Processing

Подскажите, пожалуйста, где можно раздобыть ru-sentiment? Во всех порядочных местах он удалён. Может, у кого-то завалялся с прошлых времён и он может поделиться?

источник

13:20пожаловаться #13

DV

Dima Veselov in Natural Language Processing

rusentiment.tar.xz

(1.1 Мб)

источник

13:51пожаловаться #14

IK

Ilya Kazakov in Natural Language Processing

Огромное спасибо!!

13:52пожаловаться #15

RS

Roman Samarev in Natural Language Processing

Max Kuznetsov

Я начинаю думать. Переписать на c, go и т.п., но надо начинать с pymorphy

Если переписывать, то под этот стек - https://github.com/JuliaText/TextAnalysis.jl

GitHub

JuliaText/TextAnalysis.jl

Julia package for text analysis. Contribute to JuliaText/TextAnalysis.jl development by creating an account on GitHub.

источник

14:07пожаловаться #16

D

Dmitry in Natural Language Processing

Roman Samarev

Если переписывать, то под этот стек - https://github.com/JuliaText/TextAnalysis.jl

GitHub

JuliaText/TextAnalysis.jl

Julia package for text analysis. Contribute to JuliaText/TextAnalysis.jl development by creating an account on GitHub.

Хм, Julia не самый распространенный язык сейчас.

источник

14:08пожаловаться #17

RS

Roman Samarev in Natural Language Processing

Ну так и наработки переносить - не один месяц

источник

14:09пожаловаться #18

D

Dmitry in Natural Language Processing

)))

источник

14:10пожаловаться #19

RS

Roman Samarev in Natural Language Processing

Просто из Julia-кода можно напрямую вызывать, что-нибудь уже наработанное. Был у нас некоторое время, пока не переписали, кусок, который NLTK использовал

источник

14:12пожаловаться #20