Size: a a a

R (язык программирования)

2021 April 29

ДВ

Дмитрий Володин... in R (язык программирования)
Ну это не наброс( Синтаксис - дело вкуса))
источник

ДВ

Дмитрий Володин... in R (язык программирования)
И мне нравитс синтаксис data.table. Меньше печатаешь - быстрее работаешь))
источник

IS

Ilya Shutov in R (язык программирования)
связка R data.table + clickhouse рвет всех.
https://h2oai.github.io/db-benchmark/
также проверено в бою неоднократно
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Проблема обоих только в одном - нужна подготовка, чтобы рвать))
источник

IS

Ilya Shutov in R (язык программирования)
этот тезис применим вообще к любому делу. он "платформонезависим"
источник

IS

Ilya Shutov in R (язык программирования)
а тут я изложил, почему "NO pandas"
https://habr.com/ru/post/550962/
источник

A

Aleshka in R (язык программирования)
интересно, съел бы vaex такие таблицы и как было бы по скорости
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Ну, чтобы прямо рвать, может да) Но скорее я имел ввиду, что они менее щадящие к ошибкам и прочим прелестям. Из недавнего у кликхауса. Функцией hasAny проверял наличие в массиве композитного ключа, кортежа. В искомом массиве типы элементов Tuple(Int64, Int64), в проверочном - Tuple(Int64, Nullable(Int64)). И ни ворнинга, ничего. Он просто везде проставил нули, потому что не сошлись типы данных. В документации про то, что какое-то минимальное приведение типов не производится, как в случае, например с простым сравнением двух полей Int64 == Nullable(Int64), конечно же не сказано) Но оупен сорс, что с ним поделать)
источник

IS

Ilya Shutov in R (язык программирования)
у них многое не в доках, а в презентациях с митапов можно почерпнуть.
https://github.com/ClickHouse/clickhouse-presentations
Или на https://altinity.com/blog/
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Да, спасибо. Чатик в телеграме тоже неплохой, но вопросы там какие-то админские в основном, что ли. Как элегантно что-то сделать через лямбды и массивы и избегая как огня джоинов там редко пишут(
источник
2021 April 30

PU

Philipp Upravitelev in R (язык программирования)
в R, в общем-то, вполне схожая ситуация, кажется (ну, если не брать армию производителей сахара в коммьюнити хэдливерс)
https://twitter.com/Sydonahi/status/991797172877381632
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Я верно понимаю, что в пуассоновской регрессии для интерпретации в терминах, подобных линейной регрессии, нужно взять экспоненту от оригинальных коэффициентов, поскольку мы делаем связь log?
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Не понимать.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
То есть, я просто беру экспоненту от коэффициента и интерпретирую её как процент, на который увеличивается целевая переменная. А остальная интерпретация такая же, как в линейной регрессии, всё верно я понимаю?
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Собственно, похоже, что да. Я могу интерпретировать коэффициент как увеличение логарифма количества, а могу взять экспоненту и интерпретировать экспоненту коэффициента как увеличение количества.
источник

А[

Александр [capsula]... in R (язык программирования)
Ага
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Спасибо!
источник

h

helby in R (язык программирования)
А у меня ещё к вам вопрос.

Насчет преимуществ р

Все говорят, мол в машинном обучении питон лучше

Под МЛ я имею ввиду деревья решений и нейронки

Хотя в Р, например, я годную нейронку(по результатам прогноза), построил достаточно быстро

Как думаете, справедливо ли утверждение о том что пайтон в этом лучше?

И да, не стукайте пожалуйста за провокационную тему
источник

AS

Alexander Semenov in R (язык программирования)
Имхо, справедливо.
источник

A

Andrey in R (язык программирования)
Дело же не в удачном решении одного частного случая, а в количестве и качестве имплементаций разный SOTA моделей (речь о нейронках). Для пайторча есть 100500 таких моделей
источник