Size: a a a

2021 April 30

ПФ

Паша Финкельштейн... in Moscow Spark
Нейроночка вот может основываться на нескольких параметрах: gc, шафлы и потребление памяти
источник

ЕГ

Евгений Глотов... in Moscow Spark
Вообще по умолчанию спарк читает из реляционок в 1 поток, если не задать numPartitions, колонку для партицированного чтения и её min и max
источник

ЕГ

Евгений Глотов... in Moscow Spark
Кидай скриншоты stage чтения из оракла, посмотрим, что за дичь
источник

ДМ

Даниил Московский... in Moscow Spark
Сеточка любит когда парамтеров и в целом данных очень много. Бустинг побыстрее обучится, да и интерпретируемость хоть какая-никакая будет
источник

ПФ

Паша Финкельштейн... in Moscow Spark
На бустинг у тебя времени не хватит - тебе же реально придётся модель гонять
источник

РД

Роман Друзык... in Moscow Spark
Да, сейчас
источник

ПФ

Паша Финкельштейн... in Moscow Spark
А в сеточку ты можешь собранные данные подавать
источник

ДМ

Даниил Московский... in Moscow Spark
Ты также и в бустинг можешь подавать
источник

ПФ

Паша Финкельштейн... in Moscow Spark
А данных будет много
источник

ДМ

Даниил Московский... in Moscow Spark
Инференс у бустинга шустрее, чем у сеточки все-таки
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Хм. Тогда да, наверное
источник

ДМ

Даниил Московский... in Moscow Spark
Если соберешь данные, заливай куда-нибудь, можно будет их повертеть)
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Так у меня меньше всех данных есть - у меня же ничего серьёзного на спарке нет
источник

ЕГ

Евгений Глотов... in Moscow Spark
А нейронка пофиксит баг, когда драйвер спарк-сессии из-за нехватки оперативы уходит в бесконечный GC, при котором отжирает весь проц?)
источник

ПФ

Паша Финкельштейн... in Moscow Spark
А часть всего ещё надо придумать как собирать
источник

DB

Dmitry Bugaychenko in Moscow Spark
Спорно. Сеточки разные есть и некоторые можно очень хорошо заточить на ЦПУ
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Я надеюсь что это будет просто статистическим выбросом, который не обработается
источник

ДМ

Даниил Московский... in Moscow Spark
Такое можно детектить, даже без сеточки. Или по метрикам не увидишь это?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Не, не, вы не поняли прикола)
источник

DB

Dmitry Bugaychenko in Moscow Spark
Есть же GC киллер по тригеру "GC ovehead limit exceeded"
источник