Size: a a a

R (язык программирования)

2021 April 25

ЕК

Евгений Ковалев... in R (язык программирования)
А как мне тогда, если не средние? Ведь у меня большой датасет, где у каждого часа минимум 10тыс новостей. Я думаю, что нужно найти среднее количество просмотров для каждого сайта и визуализировать как-нибудь
источник

DP

Dmitry Perepechin in R (язык программирования)
Лайк
источник

ИЭ

Илья Эйдлин... in R (язык программирования)
ну я вот скрипки предложил. средние не ясно какую функцию несут. есть у вас популярный сайт, там много и популярных постов, и непопулярных
источник

ЕК

Евгений Ковалев... in R (язык программирования)
Для меня в данном случае популярность не важна, мне просто нужно количество просмотров от времени
источник

ИЭ

Илья Эйдлин... in R (язык программирования)
ну вот у вас есть Хабрахабр, на нем есть пост компании Яндекс, у которого 1000 просмотров и 999 постов от рядовых юзеров, у которых по 0 просмотров.
есть ваш личный блог, где 1 просмотр.

у обоих сайтов по одному просмотру в среднем. если вас это устраивает, то пожалуйста
источник

ЕК

Евгений Ковалев... in R (язык программирования)
Простите что так часто по пустякам пишу, но я очень сильно туплю, у меня есть 2 столбца данных: просмотры и часы, я хочу построить plot, где X - часы, Y-количество просмотров
Думал вот так сделать:

library(janitor)
grouped_news = tabyl(data, hours, views)

plot(grouped_age$hours, grouped_age$views, type="l", col="blue", xlab="hours", ylab="postes")

Но выходит просто прямая
источник

ЕК

Евгений Ковалев... in R (язык программирования)
я думаю меня это устраивает
источник

a

aGricolaMZ in R (язык программирования)
Переслано от aGricolaMZ
Сегодня мы анализировали данные фильмов и сериалов Netflix. Мы порисовали облака слов и посмотрели пакеты tidytext, stopwords, ggwordcloud и ggtext. Видео и код.
источник

DS

Denis S. in R (язык программирования)
/whatever
источник

ЕК

Евгений Ковалев... in R (язык программирования)
Подскажите, пожалуйста, возможно ли по X сделать, чтобы каждый час выводился?

plot(m, ylab="Average number of views by hour", xlab="Hours", type = "o", col = "blue4")
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Попробуйте использовать ggplot2. Там тоньше настройка.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Круто!
источник

ЕК

Евгений Ковалев... in R (язык программирования)
спасибо
источник
2021 April 26

EP

Ed P in R (язык программирования)
Вот нашел: https://clauswilke.com/dataviz/

Книга именно по основам визуализации данных, т.е. более-менее универсальна. Плюс в том, что примеры на R.

Я когда этой темой интересовался, читал разную литературу и могу сказать, что вот эта книга прям способна заменить сразу несколько источников.
источник

ЕК

Евгений Ковалев... in R (язык программирования)
Спасибо большое!
источник

EP

Ed P in R (язык программирования)
что мне особенно нравится, примеры классифицированы, т.к. плохая визуализация может быть плохой в разных смыслах: уродливой, неудобной для восприятия или вовсе неправильной
источник

EP

Ed P in R (язык программирования)
источник

ЕК

Евгений Ковалев... in R (язык программирования)
Спасибо, я думал, что визуализировать данные - это самое легкое, но как оказалось с этим я дольше всего сижу
источник

PD

Pavel Demin in R (язык программирования)
спасибо за книгу! залип.
источник

AS

Alexander Semenov in R (язык программирования)
Я обвиняю.
источник