Size: a a a

2021 April 30

GP

Grigory Pomadchin in Moscow Spark
источник

GP

Grigory Pomadchin in Moscow Spark
или ты по логам гц хочешь понять скок памяти дать?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
А, это правда, часто вообще не нужен
источник

GP

Grigory Pomadchin in Moscow Spark
да почти никогда не нужен
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Но по логам Гц можно понять про природу обработки данных и про память
источник

GP

Grigory Pomadchin in Moscow Spark
он нужен или прям ясно что все уже перепробовано и там прям детали нужны
источник

GP

Grigory Pomadchin in Moscow Spark
ну тип видно что он сидит в паузе дофига
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Или хочешь выиграть 5% времени
источник

GP

Grigory Pomadchin in Moscow Spark
ага
источник

GP

Grigory Pomadchin in Moscow Spark
или у тя там специфика такая что много мусора у тя много памяти и твой гц в паузах сидит долго
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Кхм-типизированные датасеты-кхм.
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Есть немало шансов что там в функциях постоянно генерируются новые объекты
источник

PK

Pavel Klemenkov in Moscow Spark
@renardeinside поправит, но Daniel Tomes в своём легендарном докладе упоминал, что датабрикс учит модели на оптимизацию ресурсов, но пока не выходит каменный цветок
источник

РД

Роман Друзык... in Moscow Spark
Привет, кто нибудь сталкивался с подобной ситуацией:
Поднимаешь спарк сессию с динамик аллокейшн, ограничивая аппетиты -все ок, сессия отжирает положенное в конфиге, но если в этой же спрак сессии подключаешься через jdbc к ораклу, чтоб прочитать таблицу, то в этот момент сессия отжирает абсолютно все свободные ресурсы на кластере, игнорируя конфиг
Почему так может быть?
источник

ДМ

Даниил Московский... in Moscow Spark
Можно, но тут все упрется в то, что пространство параметров и внешних факторов слишком велико, чтобы в одну модель запихать. Хотя что-то простое можно запилить и потом на практике посмотреть, помогает ли такое
источник

ДМ

Даниил Московский... in Moscow Spark
А можно ссылку, сходу что-то не гуглится
источник

PK

Pavel Klemenkov in Moscow Spark
источник

ЕГ

Евгений Глотов... in Moscow Spark
Сколько раз подключались к ораклу по jdbc (очень много) - всё было ок
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Да не, конечно нейроночка нужна, а не бустинг
источник

ДМ

Даниил Московский... in Moscow Spark
С сеточкой все еще сложнее будет)
источник