Size: a a a

2020 August 07

T

T in Moscow Spark
Fred Redmond
Как вы боретесь с тем, что хочется взять и сжечь все кривое легаси к черту? И одновременно осознавать тот факт, что писать все заново не потянешь ни ты ни твои коллеги ни даже Будда,  узревший миллиарды и миллиарды строчек говнокода. А ещё, что менять это в принципе никому кроме тебя не надо, и ты, видимо единственный, кто ездит в этой темной комнате без окон на этом велосипеде с квадратными колёсами  и дилдаком вместо сидушки.  Ведь у твоих «помощников» KPI на поставку квадратных колёс и дизайн музыкального сопровождения.?
у меня в команде 2х людей больше чем надо, мы за полгода весь технический долг раскидали неспеша
источник

D

Dima Kubitskiy in Moscow Spark
Fred Redmond
Как вы боретесь с тем, что хочется взять и сжечь все кривое легаси к черту? И одновременно осознавать тот факт, что писать все заново не потянешь ни ты ни твои коллеги ни даже Будда,  узревший миллиарды и миллиарды строчек говнокода. А ещё, что менять это в принципе никому кроме тебя не надо, и ты, видимо единственный, кто ездит в этой темной комнате без окон на этом велосипеде с квадратными колёсами  и дилдаком вместо сидушки.  Ведь у твоих «помощников» KPI на поставку квадратных колёс и дизайн музыкального сопровождения.?
зачем бороться, присоединяйся!
источник

GP

Grigory Pomadchin in Moscow Spark
Fred Redmond
Как вы боретесь с тем, что хочется взять и сжечь все кривое легаси к черту? И одновременно осознавать тот факт, что писать все заново не потянешь ни ты ни твои коллеги ни даже Будда,  узревший миллиарды и миллиарды строчек говнокода. А ещё, что менять это в принципе никому кроме тебя не надо, и ты, видимо единственный, кто ездит в этой темной комнате без окон на этом велосипеде с квадратными колёсами  и дилдаком вместо сидушки.  Ведь у твоих «помощников» KPI на поставку квадратных колёс и дизайн музыкального сопровождения.?
ты можешь взят на себя отвественность и сжечь его или предложит план по истреблению его
если у тебя есть такие возможности конечн
источник

D

Dima Kubitskiy in Moscow Spark
> это в принципе никому кроме тебя не надо
Хорошо что ты сам это понимаешь. Признание - первый шаг на пути к исцелению
источник
2020 August 08

☭S

☭ ⤳ λ Shinkevich... in Moscow Spark
1204
Так на Котлине уже можно спарк приложения писать, а на .net?
Мне кажется, если завезут .net в спарк, то народу больше добавится, считая целая платформа сможет зайти. Я не прав?
p.s. сам я на Котлине пишу
Уже что-то видел от мелкомягких....  https://docs.microsoft.com/ru-ru/dotnet/spark/what-is-apache-spark-dotnet
источник
2020 August 10

AS

Artem Seleznev in Moscow Spark
Коллеги, для pyspark создавали свои типы данных на основе used defined types?
источник

IV

Ilya Vanin in Moscow Spark
Artem Seleznev
Коллеги, для pyspark создавали свои типы данных на основе used defined types?
Сам не делал, но можно попробовать покопаться на примере библиотечки GeoSpark
https://github.com/DataSystemsLab/GeoSpark/search?q=udt&unscoped_q=udt
источник
2020 August 11

AS

Artem Seleznev in Moscow Spark
Спасибо
источник
2020 August 14

DM

Dmitry Mittov in Moscow Spark
Коллеги, а кто-то использует Spark на Kubernetes кластере?
Сейчас стартап стартапим и заезжаем в GCP (aka Google Cloud Platform).
У них есть такая интересная опция.

Ожидания: пошарить вычислительные мощности с другими сервисами и поднять утилизацию ресурсов.

В чем вопрос: интересны pitfalls и чего вы достигли с такой опцией по сравнению с обычным кластером.

Optional: если еще и опыт сочетания всего этого с kubeflow - вообще огонь
источник

PK

Pavel Klemenkov in Moscow Spark
Dmitry Mittov
Коллеги, а кто-то использует Spark на Kubernetes кластере?
Сейчас стартап стартапим и заезжаем в GCP (aka Google Cloud Platform).
У них есть такая интересная опция.

Ожидания: пошарить вычислительные мощности с другими сервисами и поднять утилизацию ресурсов.

В чем вопрос: интересны pitfalls и чего вы достигли с такой опцией по сравнению с обычным кластером.

Optional: если еще и опыт сочетания всего этого с kubeflow - вообще огонь
Имхо по опциональной части. В жопу kubeflow. Mlflow с seldon проще и надёжней.
источник

DM

Dmitry Mittov in Moscow Spark
Но ведь seldon же про serving
источник

DM

Dmitry Mittov in Moscow Spark
можно в личку спросить про kubeflow/mlflow?
источник

PK

Pavel Klemenkov in Moscow Spark
Dmitry Mittov
можно в личку спросить про kubeflow/mlflow?
Давай
источник

DZ

Dmitry Zuev in Moscow Spark
Dmitry Mittov
Коллеги, а кто-то использует Spark на Kubernetes кластере?
Сейчас стартап стартапим и заезжаем в GCP (aka Google Cloud Platform).
У них есть такая интересная опция.

Ожидания: пошарить вычислительные мощности с другими сервисами и поднять утилизацию ресурсов.

В чем вопрос: интересны pitfalls и чего вы достигли с такой опцией по сравнению с обычным кластером.

Optional: если еще и опыт сочетания всего этого с kubeflow - вообще огонь
Нормальное управление зависимостями, безболезненный переезд между версиями, отдельные пулы для hpc и для задач с гпу
источник

DZ

Dmitry Zuev in Moscow Spark
Ну и пулы конечно autoscale
источник
2020 August 16

А

Алексей in Moscow Spark
Подскажите, вы используете аккумуляторы в своих спарк разработках? По ним мало информации в интернете,  складывается впечатление, что они deprecated
источник

ФМ

Федор Мануковский... in Moscow Spark
V2 использовал, он не deprecated
Вот тут есть пример кастомного: https://stackoverflow.com/questions/42293798/how-to-create-custom-set-accumulator-i-e-setstring
источник

А

Алексей in Moscow Spark
спс, а для чего обычно используете? Для отладки?
источник

ФМ

Федор Мануковский... in Moscow Spark
Алексей
спс, а для чего обычно используете? Для отладки?
один раз только пользовался, было что-то вроде сбора метрик — как часто строка бродкаста используется
источник
2020 August 17

AS

Andrey Smirnov in Moscow Spark
Алексей
Подскажите, вы используете аккумуляторы в своих спарк разработках? По ним мало информации в интернете,  складывается впечатление, что они deprecated
используется для накопления чего-либо (надо учитывать специфику, что задача может быть перезапущена и повторно будет обновлен аккумулятор) или для прогресса выполнения, но не очень удобно, т.к. значение становится видно только после выполнения таска
источник