Size: a a a

R (язык программирования)

2021 January 14

AB

Alexey Burnakov in R (язык программирования)
прошлые документы тоже не ломаются
источник

JL

Julia Laryushina in R (язык программирования)
короче говоря, есть кто умный? там есть лишняя экранированная кавычка, притом невидимая, которая всё портит, но проблема чинится fill=TRUE
источник

JL

Julia Laryushina in R (язык программирования)
Alexey Burnakov
прошлые документы тоже не ломаются
это здорово =)
но блин
источник

JL

Julia Laryushina in R (язык программирования)
Alexey Burnakov
Да, робит. И намного быстрее (что ожидаемо), сделаю так ))) Спасибо!!!!
👌.
источник

AB

Alexey Burnakov in R (язык программирования)
Julia Laryushina
короче говоря, есть кто умный? там есть лишняя экранированная кавычка, притом невидимая, которая всё портит, но проблема чинится fill=TRUE
Елки на. Я даже на знаю в каком редакторе это пишут... Варианты - Word или Lotus Notes.
источник

AB

Alexey Burnakov in R (язык программирования)
И это 1 / 64 случилось
источник

AB

Alexey Burnakov in R (язык программирования)
как раз когда я был не в себе после новогодних застолий
источник

PU

Philipp Upravitelev in R (язык программирования)
чисто навскидку предположение, без ковыряния в данных - fread видит, что ячеек в строке меньше, чем колонок. и fill добавляет пустую ячейку
я бы тут посмотрел, не съехали ли данные в строках, чтобы fill не в конец строки добавлялся
источник

PU

Philipp Upravitelev in R (язык программирования)
Julia Laryushina
короче говоря, есть кто умный? там есть лишняя экранированная кавычка, притом невидимая, которая всё портит, но проблема чинится fill=TRUE
это не лишняя кавычка, это знак табуляции потерян, мне кажется
иногда такое бывает, сбоят данные.
хуже, когда рандомно \t\t или лишние \t на строке появляется, и ты не знаешь, это реально пропуски в данных и пустые ячейки, или задвоение
источник

АК

Артём Клевцов... in R (язык программирования)
Справедливости ради стоит заметить, что readr всё же более всеяден. fread часто капризничает на сломанных файлах, но его отчасти спасает возможность препроцессинга через команду bash/ps.
источник

AB

Alexey Burnakov in R (язык программирования)
Век живи век учись. Попробую завтра readr. Спасибо
источник

AB

Alexey Burnakov in R (язык программирования)
Philipp Upravitelev
это не лишняя кавычка, это знак табуляции потерян, мне кажется
иногда такое бывает, сбоят данные.
хуже, когда рандомно \t\t или лишние \t на строке появляется, и ты не знаешь, это реально пропуски в данных и пустые ячейки, или задвоение
Спасибо! Видимо, редкий сбой
источник

AB

Alexey Burnakov in R (язык программирования)
источник

AB

Alexey Burnakov in R (язык программирования)
источник

AB

Alexey Burnakov in R (язык программирования)
😜
источник

S

Stan in R (язык программирования)
++ Dirty data как жидкость на полу
источник

EP

Ed P in R (язык программирования)
только тогда уж эксель должен быть турбореактивным велком с крылышками)))
Ну как у Фантомаса летающая тачка, только велик.
источник

ЭА

Эдик Амперян... in R (язык программирования)
Пересматриваю запись второго вебинара по DT...
После 50-й минуты в части множественного присвоения есть такой момент (https://upravitelev.gitlab.io/r_webinars/data-table-intro-pt2.html#colnames):

# одновременно изменим колонки
my_dt[, (tg_cols) := list(e1 * 2, e4 = gsub('_', '', e4), e5 - 1)]

Но если убрать зачеркнутое e4 = и сделать так:
my_dt[, (tg_cols) := list(e1 * 2, gsub('_', '', e4), e5 - 1)]

То результат тот же самый.
Это "избыточность" DT или понимать как-то еще ?

@konhis подскажите
источник

AB

Alexey Burnakov in R (язык программирования)
Ed P
только тогда уж эксель должен быть турбореактивным велком с крылышками)))
Ну как у Фантомаса летающая тачка, только велик.
Там можно многое сделать. Согласен) Это скорее про тренды в общественном мнении.
источник

AB

Alexey Burnakov in R (язык программирования)
Stan
++ Dirty data как жидкость на полу
Чтобы работать с dirty data нужен Dirty Angel 😄
источник