Size: a a a

2021 April 04

АР

Андрей Романов... in Moscow Spark
@essbase как говорится,коллега, выбирайте , не скупитесь!)
источник

T

T in Moscow Spark
Nikita Blagodarnyy
Тестируем скала-тестом и тестконтейнерами.
Есть, конечно. Написал ты например функцию, которая df агрегирует row_number-ом, сделал входной детальный датафрейм, скормил его функции, получил схлопнутый, скормил его ассерту-профит.
про метрики это надо в сторону аккумуляторов смотреть.
+++
источник

N

Nikita Blagodarnyy in Moscow Spark
er@essbase.ru
на гите есть примеры подобного похода ?
есть. в самом спарке есть раздел с тестами, они примерно то же самое делают.
конкретно наше не деплоили пока, убалтываю народ.
источник

АР

Андрей Романов... in Moscow Spark
плюс иногда тест=контейнеры можно заменить embedded-версиями
источник

АР

Андрей Романов... in Moscow Spark
(если можно)
источник

N

Nikita Blagodarnyy in Moscow Spark
фаст-тест это скорее набор хелперов. я не видел там именно какого-то тестирования бизнес-логики. может в глаза долбился.
источник

NN

No Name in Moscow Spark
Есть deequ
источник

N

Nikita Blagodarnyy in Moscow Spark
Андрей Романов
плюс иногда тест=контейнеры можно заменить embedded-версиями
а можно на тестовые стенды, когда ну совсем лениво
источник

N

Nikita Blagodarnyy in Moscow Spark
источник

АР

Андрей Романов... in Moscow Spark
хех
источник

N

Nikita Blagodarnyy in Moscow Spark
мы все подняли в контейнерах, но вот с фениксом чет пока никак.
источник

ЕГ

Евгений Глотов... in Moscow Spark
T
В чем смысл переписывать на df если переписывать то над брать ds . slowpoke.jpg
Успехов на ds витрину из 20 источников на 3к фичей с автогенерацией этих самых фичей)
источник

T

T in Moscow Spark
Евгений Глотов
Успехов на ds витрину из 20 источников на 3к фичей с автогенерацией этих самых фичей)
Можно декомпозировать по подгруппам. Все зависит на сколько критична ветрина
источник

ЕГ

Евгений Глотов... in Moscow Spark
Любой продакт вам скажет, что витрина супер критична и нужна была позавчера, пока будете на датасетах писать, пора будет на пенсию выходить)
источник

ПФ

Паша Финкельштейн... in Moscow Spark
er@essbase.ru
Скажите а что и как вы тестируете в Спарке для DF ?
 есть ли примеры кода когда тестами покрывается качество данных, результат расчета .
можно ли в самом расчете проверить рухнул ли определенный таск и какие были метрики DF в момент падения ?
+great expectations
источник

АР

Андрей Романов... in Moscow Spark
Nikita Blagodarnyy
фаст-тест это скорее набор хелперов. я не видел там именно какого-то тестирования бизнес-логики. может в глаза долбился.
ну кстати возможно, но обновляемой альтернативы для тестов на питоне я не нашёл(
источник
2021 April 05

AK

Alena Korogodova in Moscow Spark
No Name
Есть deequ
а ты пробовал его?
источник

NN

No Name in Moscow Spark
Alena Korogodova
а ты пробовал его?
Ну так, слегка потестил. Вроде работает)
источник
2021 April 06

AK

Alena Korogodova in Moscow Spark
Кто хотел разнообразия в спаме? Пожалуйста))
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Чатик, а вы знаете про конфу datalove, которая совсем скоро? https://datalove.konfy.care/
И вы только посомтрите какой там лайнап? Я не видел Холден уже больше года, например!
источник