Телеграмм чат группы moscowspark страница 654

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Moscow Spark

1066 membersпожаловаться на группу

2021 April 29

ДМ

Даниил Московский... in Moscow Spark

Так и делаем сейчас по сути

источник

16:13пожаловаться #1

R

Renarde in Moscow Spark

ну и обычно из 10^4 столбцов 10-20 имеют вообще хоть какой-то вес в модели, а все остальное просто длинный хвост с мусором / шумом

источник

16:13пожаловаться #2

PK

Pavel Klemenkov in Moscow Spark

Да большинство так и делает. Проблема только в том, что пайплайн обучения и пайплайн инференса превращается в две разные сущности. Их надо поддерживать, синкать. Можно кастомные эстиматоры для spark ml написать, но тоже поддерживать придется. А хочется ведь счастья и лениться )

источник

16:14пожаловаться #3

AZ

Alexey Zinoviev in Moscow Spark

Что то надо сделать с числом колонок, может как-то свернуть в строки, вдруг это какой-то временной ряд в строку записанный, просто 10000 колонок ниоткуда не берутся

источник

16:14пожаловаться #4

ДМ

Даниил Московский... in Moscow Spark

Ну это все про специфику уже. Бывает, что да, пары фичей хвататет для хорошего качества. Но бывает надо из всего выжимать скор по сотым долям

источник

16:14пожаловаться #5

PK

Pavel Klemenkov in Moscow Spark

Более того бустинг на таком количестве фичей - это просто шляпа

источник

16:14пожаловаться #6

R

Renarde in Moscow Spark

так обычно получается переобучение 😂

источник

16:14пожаловаться #7

ДМ

Даниил Московский... in Moscow Spark

Вот как раз хочу фреймворк выбрать и весь зоопарк внутренних поделок под него подогнать

источник

16:14пожаловаться #8

ПФ

Паша Финкельштейн... in Moscow Spark

Для этого господь дал нам карточки нвидиа, нет?

источник

16:15пожаловаться #9

ДМ

Даниил Московский... in Moscow Spark

Главное валидацию правильно настроить)

источник

16:15пожаловаться #10

AZ

Alexey Zinoviev in Moscow Spark

Господь их дал не для этого

источник

16:15пожаловаться #11

PK

Pavel Klemenkov in Moscow Spark

Ну нее, Дженсен максимум на апостола тенят, что уж тут душой кривить ))

источник

16:15пожаловаться #12

R

Renarde in Moscow Spark

вот вот, на указанных объемах как раз выглядит логичным использовать карточки с petastorm/horovod/etc

источник

16:15пожаловаться #13

ПФ

Паша Финкельштейн... in Moscow Spark

Я смотрю в этом чате опасно шутить

источник

16:15пожаловаться #14

ПФ

Паша Финкельштейн... in Moscow Spark

С таким настроением ты бегемотика не продашь

источник

16:16пожаловаться #15

ДМ

Даниил Московский... in Moscow Spark

Сети обучать это одно, а вот бустинги просто так не пообучаешь на разных машинках без всяких протоколов/обвязок

источник

16:16пожаловаться #16

AZ

Alexey Zinoviev in Moscow Spark

Из за таких людей с жирными матрица и, которым лень сэмплировать или факторизовать, карточки стоят как корова, для игроманов тяжёлые времена

источник

16:17пожаловаться #17

R

Renarde in Moscow Spark

кстати еще веселый трюк - добавить среди колонок одну со случайным шумом и посчитать f-importance любым быстрым алгоритмом

источник

16:17пожаловаться #18

ПФ

Паша Финкельштейн... in Moscow Spark

Ну я надеюсь что хоть у Паши от этого зарплата растёт

источник

16:17пожаловаться #19

AZ

Alexey Zinoviev in Moscow Spark

Вы как начнёте копать, пишите мысли по ходу, полезные моменты подняли

источник

16:17пожаловаться #20