Size: a a a

R language and Statistical data analysis

2020 May 12

S

Stan in R language and Statistical data analysis
Я тут вообще развиваю свою реализацию топик модель на на графах. Вот через питон отказалось несколько муторно. В принципе в R уже неплохо должно быть со стеммингом и лемматизацией русского языка.
источник

A

Andrey in R language and Statistical data analysis
Ну там не совсем 1 слой
источник

A

Andrey in R language and Statistical data analysis
Хотя можно и в 1 завернуть, наверное
источник

S

Stan in R language and Statistical data analysis
Stan
Я тут вообще развиваю свою реализацию топик модель на на графах. Вот через питон отказалось несколько муторно. В принципе в R уже неплохо должно быть со стеммингом и лемматизацией русского языка.
В Питоне, несмотря на целый вагон пакетов, в некоторых случаях нужно нет. Вот тебе и многообразие :(
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Andrey
На гитхабе bnosac/golgotha толпа этих ваших маппетов сесть
Да, вижу. Спасибо
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Andrey
Хотя можно и в 1 завернуть, наверное
Он и не должен быть один если это transformer
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Там каскад
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Видимо я именно attention искал, чтобы его поковырять и понять
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Stan
Я тут вообще развиваю свою реализацию топик модель на на графах. Вот через питон отказалось несколько муторно. В принципе в R уже неплохо должно быть со стеммингом и лемматизацией русского языка.
А оно и делается обычно не на графах
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Alexey Burnakov
А оно и делается обычно не на графах
Я больше увлёкся latent stochastic modelling
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Про то же и Воронцов. Artm
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Там идёт декомпозиция матрицы document-term типа svd
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Но итеративный алгоритм обогащен регуляризаторами
источник

JS

Jury Sergeev in R language and Statistical data analysis
а попадалось кому-то обертка для bigARTM?
источник

JS

Jury Sergeev in R language and Statistical data analysis
там же есть cpp/c api, теоретически можно работать с апи из R?
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Alexey Burnakov
А оно и делается обычно не на графах
Если делать на графе, важен выбор метода кластеризации. И связи между узлами продумать надо. Как вариант, cosine on tf-idf
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Jury Sergeev
а попадалось кому-то обертка для bigARTM?
До самоизоляции не было такого пакета
источник

AB

Alexey Burnakov in R language and Statistical data analysis
)
источник

AS

Alexander Semenov in R language and Statistical data analysis
Alexey Burnakov
Про то же и Воронцов. Artm
Слышал от падаванов Воронцова противоречивые вещи про этот ARTM.
источник

JS

Jury Sergeev in R language and Statistical data analysis
Alexey Burnakov
До самоизоляции не было такого пакета
так то не пакет, алгоритм и реализация, Воронцов тоже в команде
источник