Size: a a a

R (язык программирования)

2020 June 04

ЕТ

Евгений Томилов... in R (язык программирования)
aGricolaMZ
Он умеет, но mystem лучше
Я ваш курс посмотрел частями, вдохновился немного, решил в обработку языка углубиться.
источник

a

aGricolaMZ in R (язык программирования)
Лис
"Доверительные интервалы для коэффициентов в логистической регрессии не должны пересекать 0 (или 1 для логитов). "  это верно или нет?) кто подскажет
Я считаю, что это неверно и доверительные интервалы для коаффициентоа могут перестать что угодно
источник

a

aGricolaMZ in R (язык программирования)
Евгений Томилов
Я ваш курс посмотрел частями, вдохновился немного, решил в обработку языка углубиться.
О, спасибо! Но я там вроде что-то говорил про udpipe
источник

ЕТ

Евгений Томилов... in R (язык программирования)
aGricolaMZ
О, спасибо! Но я там вроде что-то говорил про udpipe
А планируется ещё расширение какое-нибудь?  Я не в курсе просто.
источник

a

aGricolaMZ in R (язык программирования)
Скорее нет. Но я вот книжку пишу
источник

ЕТ

Евгений Томилов... in R (язык программирования)
aGricolaMZ
Скорее нет. Но я вот книжку пишу
О, я бы купил даже.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
aGricolaMZ
О, спасибо! Но я там вроде что-то говорил про udpipe
Да, там было про udpipe, но там не было про лемматизацию, насколько я помню.
источник

a

aGricolaMZ in R (язык программирования)
Ну может быть
источник

PU

Philipp Upravitelev in R (язык программирования)
aGricolaMZ
Скорее нет. Но я вот книжку пишу
а про что книжка? :)
источник

a

aGricolaMZ in R (язык программирования)
Philipp Upravitelev
а про что книжка? :)
А я мне кажется уже кидал сюда: https://agricolamz.github.io/DS_for_DH/
источник

PU

Philipp Upravitelev in R (язык программирования)
а, да, было дело
просто тогда ты сказал, что это материалы по курсу :)
источник

S

Stan in R (язык программирования)
Mystem жирный топ. Использую в Science
источник

a

aGricolaMZ in R (язык программирования)
Philipp Upravitelev
а, да, было дело
просто тогда ты сказал, что это материалы по курсу :)
вот я и хочу их превратить в книгу. В каком-то смысле весь код (большей частью) уже написан, осталось написать текст и сделать пакет с датасетами
источник

a

aGricolaMZ in R (язык программирования)
Yuriy Saraikin
Добрый день! Кто может, проверьте, пожалуйста поведение
tidyr::pivot_longer
v.1.1.0. Почему-то не появляется контексное меню при вводе параметров команды.
df <- tibble(id = 1, wk1 = 0, wk2 = 4, wk3 = 9, wk4 = 25)
у меня кстати появляется с dplyr 1.0.0
источник

YS

Yuriy Saraikin in R (язык программирования)
aGricolaMZ
у меня кстати появляется с dplyr 1.0.0
Да, спасибо. Я откатился на tidyr 1.0.0. Там нормально работает.  На dplyr 1.0.0 пока не замечал
источник

a

aGricolaMZ in R (язык программирования)
ой, я хотел сказать на tidyr 1.1.0
источник

YS

Yuriy Saraikin in R (язык программирования)
Ага, спасибо. Значит общая проблема.
источник

AB

Alexey Burnakov in R (язык программирования)
Евгений Томилов
Ага, через обвязку R mystem семь миллионов слов около 10 минут лемматизирует на i7 8gen.
Я использую mystem параллельно, ускоряет заметно, но не линейно. udpipe на некоторых словах неправильные словоформы выдаёт и не получилось распараллелить
источник

AB

Alexey Burnakov in R (язык программирования)
Alexey Burnakov
Я использую mystem параллельно, ускоряет заметно, но не линейно. udpipe на некоторых словах неправильные словоформы выдаёт и не получилось распараллелить
Подаю целиком текст как единицу анализа. Получалось примерно 10М слов (20-30 тыс.текстов) отработать минут за 20. 0.05 секунды на текст в среднем. Как разовое предприятие нормально, потом догоняюсь инкрементами каждые несколько минут.
источник

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
Alexey Burnakov
Я использую mystem параллельно, ускоряет заметно, но не линейно. udpipe на некоторых словах неправильные словоформы выдаёт и не получилось распараллелить
👍
источник