Size: a a a

2021 March 06

ЕГ

Евгений Глотов... in Moscow Spark
Alex
Апрель 2015, то есть в проде почти у никого
Это ещё какая-нибудь версия 1.5 была?)
источник

A

Alex in Moscow Spark
Вот версию не помню, первый раз счупал спарк он точно не больше чем 0.8 был :(
источник

ЕГ

Евгений Глотов... in Moscow Spark
Щас столько оптимизаций уже подвезли, а диски стоят на абсолютном нуле, за 5 лет не поменялось совсем нихрена
источник

ЕГ

Евгений Глотов... in Moscow Spark
В итоге обратно в диски упираемся
источник

A

Alex in Moscow Spark
С чего бы это? Ссд под ворк дир, одного мало, поставь 2, 3, хоть рейд собери
источник

A

Alex in Moscow Spark
Вот шафл через диск даже если все в память влазит это уже другой вопрос к самому спарку :)
источник

ЕГ

Евгений Глотов... in Moscow Spark
Alex
С чего бы это? Ссд под ворк дир, одного мало, поставь 2, 3, хоть рейд собери
Работал я как-то на кластере с tmp raid ssd...
источник

A

Alex in Moscow Spark
Хотя сейчас с плагинными шафл серверами уже можно лучше делать
источник

ЕГ

Евгений Глотов... in Moscow Spark
У нас больше времени тратилось на замену ссд, чем на вычисления)
источник

ЕГ

Евгений Глотов... in Moscow Spark
Alex
Хотя сейчас с плагинными шафл серверами уже можно лучше делать
Вроде в 3 завезли встроенный шафл трекер
источник

ЕГ

Евгений Глотов... in Moscow Spark
Но иногда он проваливает запросы из-за преемпшена
источник

ЕГ

Евгений Глотов... in Moscow Spark
Alex
Вот шафл через диск даже если все в память влазит это уже другой вопрос к самому спарку :)
Инмемори вычисления
источник

ЕГ

Евгений Глотов... in Moscow Spark
источник

A

Alex in Moscow Spark
Lightning fast
Spark это не ваш древний MapReduce
источник

A

Alex in Moscow Spark
И другие сказки нашего города
источник

ИК

Иван Калининский... in Moscow Spark
Alex
Хотя сейчас с плагинными шафл серверами уже можно лучше делать
Расскажи, пожалуйста, что это за плагинные шафл серверы, какие преимущества они дают и какие лучше адоптить?
источник

A

Alex in Moscow Spark
раньше шафл был зашит глубоко в коде
проблема была с кубиком, у него нету возможность запустить yarn shuffle service и убить сам контейнер со спарком, оставив данные для возможности запроса со стороны

поэтому в кубике норм работает динамическое увеличение, но не уменьшение спарк кластера
источник

A

Alex in Moscow Spark
источник

A

Alex in Moscow Spark
как-то так
источник

A

Alex in Moscow Spark
то есть работа ещё не закончена, но в сабтасках уже можно глянуть что было сделано в этом направлении
источник