Size: a a a

R (язык программирования)

2021 February 17

AS

Alexander Semenov in R (язык программирования)
Дмитрий Володин
Да, у нас поменьше событий, но пара миллионов с учётом событий из apssflyer прилетает. Пока в начале пути, развиваемся))
На днях пытался почистить 300 строк говнокода для данных из AppsFlyer, где половина -- какие-то регулярки.
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Philipp Upravitelev
попросите реплику себе. всем проще будет.
Уже есть. Но реплика полностью реплика, в неё пишется на лету, также, как в прод. А я своими запросами там всё ломаю(. Вчера плюнул и пошёл в Р всё считать и загружать почти прямо обратно агрегаты
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Alexander Semenov
На днях пытался почистить 300 строк говнокода для данных из AppsFlyer, где половина -- какие-то регулярки.
Ой, я туда вообще не лезу и события его меня подбешивают немного. Дофига, а толку чуть. И не знаю, как везде, но у нас appsflyer_id - это строка. В чьём воспалённом сознании родилась идея хранить айдишник стрингой - я не знаю))
источник

AS

Alexander Semenov in R (язык программирования)
У нас ID с 0 могут начинаться и этот 0 иногда теряется при преобразовании данных в Excel и даже до него. Вот где ад-то.
источник

PU

Philipp Upravitelev in R (язык программирования)
Дмитрий Володин
Уже есть. Но реплика полностью реплика, в неё пишется на лету, также, как в прод. А я своими запросами там всё ломаю(. Вчера плюнул и пошёл в Р всё считать и загружать почти прямо обратно агрегаты
там есть правила, которое обеспечиваею синхронизацию
типа, если есть запрос, синхронизация тормозится. я так работал с постгре-репликой боевого проекта совсем недавно, и даже запросами с регулярками и json-ами не убил бд.
так что, может быть, стоит просто конфиги пошатать
источник

ДВ

Дмитрий Володин... in R (язык программирования)
И всё упирается в бизнес-процессы, документацию и порядок в данных
источник

PU

Philipp Upravitelev in R (язык программирования)
а это в любом случае придется решать в какой-то момент
иначе техдолг вырастет и масштабироваться будет очень больно
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Philipp Upravitelev
там есть правила, которое обеспечиваею синхронизацию
типа, если есть запрос, синхронизация тормозится. я так работал с постгре-репликой боевого проекта совсем недавно, и даже запросами с регулярками и json-ами не убил бд.
так что, может быть, стоит просто конфиги пошатать
Ага, в клике явно такого нет(( сейчас девопс с разрабом сидят и думают, как бы это сделать, чтобы мои запросы им инсёрты не роняли. А я что? А я пишу следующий запрос, потому что бизнесу нужны новые циферки))
источник

PU

Philipp Upravitelev in R (язык программирования)
Дмитрий Володин
Ага, в клике явно такого нет(( сейчас девопс с разрабом сидят и думают, как бы это сделать, чтобы мои запросы им инсёрты не роняли. А я что? А я пишу следующий запрос, потому что бизнесу нужны новые циферки))
а, кликхаус.
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Philipp Upravitelev
а это в любом случае придется решать в какой-то момент
иначе техдолг вырастет и масштабироваться будет очень больно
Эти слова я повторяю почти каждый день((
источник

AS

Alexander Semenov in R (язык программирования)
Philipp Upravitelev
а это в любом случае придется решать в какой-то момент
иначе техдолг вырастет и масштабироваться будет очень больно
У нас это больно наступило на прошлой неделе =)
источник

PU

Philipp Upravitelev in R (язык программирования)
ну что я могу вам сказать. терпения каждый день и сил разгрести результаты потом :))))
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Спасибо))
источник
2021 February 18

PU

Philipp Upravitelev in R (язык программирования)
источник

ЕТ

Евгений Томилов... in R (язык программирования)
А какая наилучшая альтернатива MANCOVA для распределения, отличного от нормального?
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Например, для ANOVA это в общем случае критерий Краскелла-Уоллиса.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Хм, окей, предположим, я переформулировал, но всё равно не могу найти аналог многофакторного ANCOVA обоснованного. Краскелл-Уоллис не подходит, говорят, что можно Фридмана, но он тоже не подходит, вообще-то.

UPD: окей, будет GLM.
источник

ИП

Иван Поздняков... in R (язык программирования)
Евгений Томилов
Хм, окей, предположим, я переформулировал, но всё равно не могу найти аналог многофакторного ANCOVA обоснованного. Краскелл-Уоллис не подходит, говорят, что можно Фридмана, но он тоже не подходит, вообще-то.

UPD: окей, будет GLM.
Да, краскал уоллесы/фридманы только для самых простых дизайноа, поэтому тут только всякие glm
источник

AS

Alexander Semenov in R (язык программирования)
Так в ggtheme же есть тема под оффис 98 с вырвиглазными цветами. Всё жду повода кого-нибудь ею потроллить.
источник

DK

Dm Kb in R (язык программирования)
Интересно, многие считают, что “look nice” и “look like excel” - это близкие характеристики ??? Видимо на вкус и цвет...
источник