Size: a a a

R (язык программирования)

2021 April 02

AS

Alexander Semenov in R (язык программирования)
Дмитрий Володин
Предлагаю развить. Вот я как раз наоборот из кликхауса вываливаюсь в Р и дататейбл, когда надо что-то большое и сложное поджоинить))
Ну так кликхаус и не про "поджойнить большое".
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Не, прост реально быстрее))
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Alexander Semenov
Ну так кликхаус и не про "поджойнить большое".
Да-да. Знаем. Обжигались о memory limit((
источник

PU

Philipp Upravitelev in R (язык программирования)
Дмитрий Володин
Не, прост реально быстрее))
я бы с админом пообщался душевно, наверное, в такой ситуации
источник

AS

Alexander Semenov in R (язык программирования)
Я не знаю, где в продуктовой аналитике/статистике гоняются за скоростью.
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Илья Ерошенков
Скорость. Вот что надо смотреть. SQL может много кого уделать, если главное это скорость.
Это очень большой вопрос и большие скорости вызваны скорее большими вычислительными мощностями машины, на которой БД
источник

AS

Alexander Semenov in R (язык программирования)
"Посчитайте мне ARPU апрельской когорты на Андроидах не медленнее, чем за 17 секунд" -- такой что ли запрос?
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Philipp Upravitelev
я бы с админом пообщался душевно, наверное, в такой ситуации
Не, кликхаус. Он не умеет в большие джоины. Вернее говорит, что немного умеет, но врёт, собака
источник

AS

Alexander Semenov in R (язык программирования)
Мне тут эксперт по Python недавно выложил Jupyter Notebook в *.py формате и уверял, что они откроются как нормальные ноутбуки.
источник

ИЕ

Илья Ерошенков... in R (язык программирования)
Дмитрий Володин
Это очень большой вопрос и большие скорости вызваны скорее большими вычислительными мощностями машины, на которой БД
Прямота рук, как правильно сказали, первый фактор. Мощности это уже второй. Иногда просто надо соединять десяток таблиц с миллиардом записей в каждой, и по всему этому добру построить хотя бы линейную регрессию. И когда это можно сделать в оракле родными фичами, то дергать R руки не поднимаются.
источник

PU

Philipp Upravitelev in R (язык программирования)
Alexander Semenov
Я не знаю, где в продуктовой аналитике/статистике гоняются за скоростью.
запускал я сегодня большой запрос, который считает всего-то навсего время каждой сессии (то есть, интервал от логина до завершения последнего боя, начавшегося до след.логина) для одной месячной когорты 19го года.... несколько часов, блин :(
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Alexander Semenov
"Посчитайте мне ARPU апрельской когорты на Андроидах не медленнее, чем за 17 секунд" -- такой что ли запрос?
Тут соглашусь. Обычно просто успевай до дедлайна, который сам и согласовал. Более того, всем пофиг, чем ты считал. Хоть в тетрадку выписывай и по линейке считай))
источник

PU

Philipp Upravitelev in R (язык программирования)
Илья Ерошенков
Прямота рук, как правильно сказали, первый фактор. Мощности это уже второй. Иногда просто надо соединять десяток таблиц с миллиардом записей в каждой, и по всему этому добру построить хотя бы линейную регрессию. И когда это можно сделать в оракле родными фичами, то дергать R руки не поднимаются.
кстати, есть же ore и R в sql сервере оракловом, вы испольузете?
источник

AS

Alexander Semenov in R (язык программирования)
Philipp Upravitelev
запускал я сегодня большой запрос, который считает всего-то навсего время каждой сессии (то есть, интервал от логина до завершения последнего боя, начавшегося до след.логина) для одной месячной когорты 19го года.... несколько часов, блин :(
Ну так никто ж в здравом уме не потянет это всё сначала в R, чтобы поджойнить там. Богу богово - кесарю кесарево.
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Илья Ерошенков
Прямота рук, как правильно сказали, первый фактор. Мощности это уже второй. Иногда просто надо соединять десяток таблиц с миллиардом записей в каждой, и по всему этому добру построить хотя бы линейную регрессию. И когда это можно сделать в оракле родными фичами, то дергать R руки не поднимаются.
Ох уж эти ваши ораклы))
источник

ИЕ

Илья Ерошенков... in R (язык программирования)
Philipp Upravitelev
кстати, есть же ore и R в sql сервере оракловом, вы испольузете?
Знаю, есть. Но не используем.
источник

R

Rus in R (язык программирования)
Народ. Подскажите пожалуйста аналог пандасовской  pd.concat([df1, df2,df3]) в R
то есть нужно объединить одинаковые датафреймы с одинаковыми столбцами.
источник

PU

Philipp Upravitelev in R (язык программирования)
Rus
Народ. Подскажите пожалуйста аналог пандасовской  pd.concat([df1, df2,df3]) в R
то есть нужно объединить одинаковые датафреймы с одинаковыми столбцами.
cbind
источник

PU

Philipp Upravitelev in R (язык программирования)
не, rbind
источник

PU

Philipp Upravitelev in R (язык программирования)
если построчно склеить
источник