Size: a a a

R (язык программирования)

2020 June 03

ЕТ

Евгений Томилов... in R (язык программирования)
Я вижу, что 33 слова он обрабатывает около тридцати секунд.
источник

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
Евгений Томилов
А насколько большие тексты обрабатывали? 7 млн слов, например.
Не знаю, я не работал с таким объемом
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Юрий 🐙💻🤖📊📈🚬
Не знаю, я не работал с таким объемом
Окай, надеюсь, не вылетит.
источник

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
Евгений Томилов
Я вижу, что 33 слова он обрабатывает около тридцати секунд.
А сколько напрямую в командной строке винды?
источник

GS

Gleb Suvorov in R (язык программирования)
mystem тормозит при вызове по одному слову через командную строку как ужас вообще что. пробовал из R. может кнчн что-то не так делал. но пришлось выкинуть. (<100к строк запихивал)
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Юрий 🐙💻🤖📊📈🚬
А сколько напрямую в командной строке винды?
Это не пробовал ещё.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Ага, он завис.
источник

GS

Gleb Suvorov in R (язык программирования)
он стартует долго.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Gleb Suvorov
он стартует долго.
А, отлично. Надеюсь, моей оперативки хватит на это всё, потому что на сортировку триграмм её не хватило. 32Гб оперативки уже мало в наши дни, что делается.
источник

Л

Лис in R (язык программирования)
"Доверительные интервалы для коэффициентов в логистической регрессии не должны пересекать 0 (или 1 для логитов). "  это верно или нет?) кто подскажет
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Лис
"Доверительные интервалы для коэффициентов в логистической регрессии не должны пересекать 0 (или 1 для логитов). "  это верно или нет?) кто подскажет
В случае, если они пересекают, мы не можем быть уверены, положительны они или нет. Соответственно, лучше бы им этого не делать.
источник

Л

Лис in R (язык программирования)
Это понятно) но меня преподаватель исправил, сказав что НАОБОРОТ
источник

Л

Лис in R (язык программирования)
0 для логитов
источник

Л

Лис in R (язык программирования)
хочу вступить в  спор но не уверена
источник

Л

Лис in R (язык программирования)
или всё-таки, для шансов – 1, для логитов – 0 ?
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Ага, через обвязку R mystem семь миллионов слов около 10 минут лемматизирует на i7 8gen.
источник

ГД

Григорий Демин... in R (язык программирования)
Евгений Томилов
А на R вообще нет нормальных лемматизаторов для русского, что ли? Кажется, я уже все возможные перегуглил, есть только стеммеры.
udpipe довольно удобный https://cran.r-project.org/web/packages/udpipe/index.html
источник

ГД

Григорий Демин... in R (язык программирования)
По скорости. Я разбивал на отдельные слова, брал уникальные, лемматизировал их. Получал словарик к корпусу и его джойнил. Это неизмеримо быстрее, но качество лемматизации немного страдает.
источник
2020 June 04

ЕТ

Евгений Томилов... in R (язык программирования)
Григорий Демин
По скорости. Я разбивал на отдельные слова, брал уникальные, лемматизировал их. Получал словарик к корпусу и его джойнил. Это неизмеримо быстрее, но качество лемматизации немного страдает.
Спасибо. Пропустил почему-то, что он умеет в русский язык.
источник

a

aGricolaMZ in R (язык программирования)
Евгений Томилов
Спасибо. Пропустил почему-то, что он умеет в русский язык.
Он умеет, но mystem лучше
источник