Size: a a a

2021 February 20

ИК

Иван Калининский... in Moscow Spark
Паша Финкельштейн
Чувствую ответ "просто я говна нажрался"
нет, все же это scala, а не PHP
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Иван Калининский
я в банке работаю))
Но тут все где-то работают, и у многих есть весьма глубокие знания внутренностей спарка, так что конкретно место работы не так уж существенно
Правда в том, что у кого-то задачи сложнее и ограничения сильнее и им приходится лазить глубже внутрь
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Иван Калининский
нет, все же это scala, а не PHP
Спарк сложно иногда. Наверняка все тут видели эпичный тред о борьбе с холодильником с помощью спарка
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Это вот пример сильных ограничений
источник

ИК

Иван Калининский... in Moscow Spark
ну вот у меня сейчас задача решена и работает, но я вижу, что точно можно сделать лучше и это будет полезно - вот, делаю, разбираюсь
источник

ВК

Вячеслав Колосков... in Moscow Spark
Паша Финкельштейн
Спарк сложно иногда. Наверняка все тут видели эпичный тред о борьбе с холодильником с помощью спарка
я не видел. можно ссылку? :)
источник

ПФ

Паша Финкельштейн... in Moscow Spark
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Всё смеются что инструмент неправильный и методы решения тоже, но правда а том, что задача с похожими вводными в другом юзкейсе вполне могла попасться дата инженеру. Так гигантская таймсерия из которой надо сделать выводы в условиях ограниченного размера памяти
источник

ИК

Иван Калининский... in Moscow Spark
в решении сильно не хватает pyTorch ^^
источник

ИК

Иван Калининский... in Moscow Spark
pyTorch всё делает лучше хД
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Иван Калининский
в решении сильно не хватает pyTorch ^^
Лёша Зиновьев написал про нейроночки, но ведь кто-то должен размечать данные тогда!
источник

ИК

Иван Калининский... in Moscow Spark
натренировать GAN, или что там у нас сейчас в тренде
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Я искренне считаю что вот в этом стеке технологий надо было просто на партиции по минуте или типа того, нормировать данные и посчитать
источник

ИК

Иван Калининский... in Moscow Spark
а, кластеризация каким-то EM-подобным алгоритмом и отсечка по достижении кластером критического размера
источник

ИК

Иван Калининский... in Moscow Spark
хаха, шутка
источник

AS

Andrey Smirnov in Moscow Spark
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Интересно, а есть сейчас формат хранения, умеющий дельта-кодирование из коробки или надо руками?
источник

AS

Andrey Smirnov in Moscow Spark
Паша Финкельштейн
Лёша Зиновьев написал про нейроночки, но ведь кто-то должен размечать данные тогда!
кластеризация должна помочь, а она unsupervised
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Andrey Smirnov
кластеризация должна помочь, а она unsupervised
Об этом не подумал, да
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Блин сказать что нам нужно два кластера и он само всё сделает!
источник