Size: a a a

2021 February 10

t

tenKe in Moscow Spark
не может быть такого, что все это меньше 1 и floor вгоняет результат в 0 и в итоге ты получаешь одну суперпартицию?
источник

M

Mi in Moscow Spark
tenKe
не может быть такого, что все это меньше 1 и floor вгоняет результат в 0 и в итоге ты получаешь одну суперпартицию?
Судя по дебагу - так и есть, но не пойму почему это так, завтра буду дебажить
источник

M

Mi in Moscow Spark
Но вообще там count_in_partition около 18 миллионов, а required_rows где-то 800к
источник
2021 February 11

G

Gev in Moscow Spark
Народ, не подскажете, как прочитать сложно структурированный json если НЕ хочется поддерживать схему. Читать и вытаскивать только тот атрибут что мне нужен и плевать на изменения структуры json в целом
источник

G

Gev in Moscow Spark
Пр. этом json с вложенной структурой
источник

t

tenKe in Moscow Spark
get_json_object(col, pattern)
источник

G

Gev in Moscow Spark
Интересно. Вот прочитал json в DF и струтктура та же, надо только теперь понять как обратиться к нужному атрибуту
источник

M

Mi in Moscow Spark
Gev
Интересно. Вот прочитал json в DF и струтктура та же, надо только теперь понять как обратиться к нужному атрибуту
Мне кажется если это примитивное значение, то можно и регулярными искать
источник

G

Gev in Moscow Spark
Как мне из схемы DF вытянуть путь к нуному аттрибуту?
источник

t

tenKe in Moscow Spark
Gev
Как мне из схемы DF вытянуть путь к нуному аттрибуту?
не понял вопроса
источник

t

tenKe in Moscow Spark
схема это же и есть нужное тебе дерево
источник

G

Gev in Moscow Spark
Нужно селать что то вроде explode
источник

GP

Grigory Pomadchin in Moscow Spark
Gev
Нужно селать что то вроде explode
напиши псевдокод
источник

G

Gev in Moscow Spark
Развернуть структуру в обычную таблицу
источник

G

Gev in Moscow Spark
root
|-- info1: struct (nullable = true)
|    |-- field1: string (nullable = true)
|    |-- field2: string (nullable = true)
|-- info2: array (nullable = true)
|    |-- element: struct (containsNull = true)
|    |    |-- field3: string (nullable = true)
|    |    |-- field4: string (nullable = true)
|    |    |-- info3: array (nullable = true)
|    |    |    |-- element: struct (containsNull = true)
|    |    |    |    |-- field5: string (nullable = true)
|    |    |    |    |-- field6: string (nullable = true)


получить

info1 | field1 | field2 | info2 | field3 | field4 | info3 | field5 | field6 |
источник

G

Gev in Moscow Spark
До первой вложенности exploid а вот как вторую вложенность разложить не понимаю
источник

G

Gev in Moscow Spark
exploid от exploid ?
источник

G

Gev in Moscow Spark
Разобрался. exploid в неколько шагов
источник

NN

No Name in Moscow Spark
Gev
Разобрался. exploid в неколько шагов
Классика
источник

G

Gev in Moscow Spark
Вопрос
Как посчитать количество записей DF самым не тяжолым способом. по быстрому
источник