Size: a a a

R (язык программирования)

2020 September 16

O

Olya in R (язык программирования)
добрый вечер!
источник

PU

Philipp Upravitelev in R (язык программирования)
Ignatius Reilly
Добрый вечер!
Возник вопрос по визуализации в ggplot2.
Как сохранить прерывность функции на графике-линии?
Пример:
x <- seq(-3, 3, by = 0.05)
y <- 2 / (x^2 - x) # ф-ция не определена в т. 0 и 1
В base R всё норм:
plot(x, y, type = "l")
В ggplot2 появляется непрерывность:
library(ggplot2)
qplot(x, y, geom = "line)
Есть подозрения, что это сделано специально (хотя я не понимаю зачем), и нужно добавить какую-то функцию для изменения координат или типа того.
замените Inf на NA
y[is.infinite(y)] <- NA
ggplot(data.frame(x, y), aes(x, y)) +
 geom_line()
источник

IR

Ignatius Reilly in R (язык программирования)
Philipp Upravitelev
замените Inf на NA
y[is.infinite(y)] <- NA
ggplot(data.frame(x, y), aes(x, y)) +
 geom_line()
Спасибо, работает. Но согласитесь, странное решение со стороны господина Викхема в отношении Inf, заставляет придумывать костыли
источник

PU

Philipp Upravitelev in R (язык программирования)
на мой взгляд, оно очень прямолинейное, скорее, чем странное.
есть значение - рисуем, нет значения - не рисуем
а что Inf как значение нарисовать непонятно как - это вопрос второй уже
источник

PU

Philipp Upravitelev in R (язык программирования)
я лично стараюсь заменять Inf на NA почти всегда
источник

JS

Jury Sergeev in R (язык программирования)
Jury Sergeev
кто-нибудь пробовал duckdb? что-то я пока не восхитился... залили из паркет-файлов много данных - ~60 млн записей - все ок, БД получилась на ~ 13Gb

далее делаю коннект к получившейся БД - и вот процесс что-то усердно читает и сжирает всю оперативку, попутно раздувая своп ( как-то не очень оно пока юзабельно (
хммм, а вот использовать parquet-файлы как View в duckdb - супер, работает очень быстро, не ожидал даже... продолжаю тестировать
источник
2020 September 17

JS

Jury Sergeev in R (язык программирования)
duckdb - перспективная штука! за 10 минут сделать left join с таблицей в которой 113917198 записей на обычном ноуте с двумя ядрами  - отличный результат, я считаю
источник

АН

Алексей Нагорский... in R (язык программирования)
Jury Sergeev
duckdb - перспективная штука! за 10 минут сделать left join с таблицей в которой 113917198 записей на обычном ноуте с двумя ядрами  - отличный результат, я считаю
А другие бд делали сильно дольше?)
источник

JS

Jury Sergeev in R (язык программирования)
Алексей Нагорский
А другие бд делали сильно дольше?)
ну у меня таких данных еще не было под рукой ) место если найду, то попробую с другими БД
источник

АК

Артём Клевцов... in R (язык программирования)
Jury Sergeev
duckdb - перспективная штука! за 10 минут сделать left join с таблицей в которой 113917198 записей на обычном ноуте с двумя ядрами  - отличный результат, я считаю
Постгря в докере за пару минут поднимается. Так что можно сравнить.
источник

JS

Jury Sergeev in R (язык программирования)
1. Данных не было таких, теперь есть
2. Нет места под столько данных, в уткедб сейчас подключен сжатый паркет как вьюха
3. Ну и докер запустить малость геморнее (на винде) чем запустить уткудб

Потому и радость, что, вроде, может быть годной штукой, если именно на походном ноуте надо покрутить много данных... Ещё кликхаус в wsl2 работает, ещё его погонять стоит
источник

NK

Nikita Kagan in R (язык программирования)
aGricolaMZ
А что если поменять бэкслэш на форвардслэш?
поменял также
источник

АН

Алексей Нагорский... in R (язык программирования)
Jury Sergeev
1. Данных не было таких, теперь есть
2. Нет места под столько данных, в уткедб сейчас подключен сжатый паркет как вьюха
3. Ну и докер запустить малость геморнее (на винде) чем запустить уткудб

Потому и радость, что, вроде, может быть годной штукой, если именно на походном ноуте надо покрутить много данных... Ещё кликхаус в wsl2 работает, ещё его погонять стоит
Sqlite не геморнее и интересно будет сравнить (если конечно не принципиально с паркетом)
источник

JS

Jury Sergeev in R (язык программирования)
Он медленнее заведомо, ибо row-based
источник

JS

Jury Sergeev in R (язык программирования)
Паркет - колоночный формат
источник

JS

Jury Sergeev in R (язык программирования)
Так что если и сравнивать - то все же с плагином паркет для sqlite
источник

IM

Igor Maltsev in R (язык программирования)
Всем привет. Кто-нибудь занимался парсингом инстаграма? Столкнулся с тем, что недокументированная возможность получения JSON по ссылке вида https://www.instagram.com/<brandname>/?__a=1 на локальном компе работает корректно, а на сервере в гугл клауд платформ редиректит и возвращает html страницу логина вместо необходимого json
источник

DB

Daria B in R (язык программирования)
Добрый день!
Обращаюсь к психологам со знанием статистики.
Ищу человека, который в интенсивном режиме сможет со мной позаниматься две недели. Для одобрения моей кандидатуры на работу, мне необходимо хорошо разобраться с теорией, понимать, а не зазубрить «азы» - шкалы, критерии, анализ данных и чем дальше, тем лучше.

Буду рада любым откликам, спасибо!
источник

S

Stan in R (язык программирования)
Daria B
Добрый день!
Обращаюсь к психологам со знанием статистики.
Ищу человека, который в интенсивном режиме сможет со мной позаниматься две недели. Для одобрения моей кандидатуры на работу, мне необходимо хорошо разобраться с теорией, понимать, а не зазубрить «азы» - шкалы, критерии, анализ данных и чем дальше, тем лучше.

Буду рада любым откликам, спасибо!
Вам лучше регистрироваться в ods.ai и спрашивать там уже.
источник

PU

Philipp Upravitelev in R (язык программирования)
Stan
Вам лучше регистрироваться в ods.ai и спрашивать там уже.
тут удельная доля психологов больше будет, чем в одс %)
источник