Телеграмм чат группы moscowspark страница 247

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Moscow Spark

872 membersпожаловаться на группу

2020 January 24

GP

Grigory Pomadchin in Moscow Spark

а спринг только проблемы создавать себе, были же ребята тут и у них были проблемы какие-то с класс лоадерами

источник

16:23пожаловаться #1

K

KrivdaTheTriewe in Moscow Spark

Denis Gabaydulin

И запускать джобы (вызывать actions) значительно лучше в уже запущенные контексты. Получается приличная экономия если много джобов бегают круглосуточно. Можно использовать глобал кеш опять же.

Livy

источник

20:55пожаловаться #2

2020 January 28

AA

Anton Alekseev in Moscow Spark

Всем привет. Есть задача, колонку с бинарным флагом в инте смаппить на соответствующие значения из словарей, где ключ маска. тоесть флаг 17, и словарик {1: 'a', 2: 'b', 4: 'c', 8: 'd', 16: 'e'} смаппится в ['a', 'e']. Но есть доп условие, что словарик меняется в зависимости от еще одной колонки (column_property), и нужно выбирать словарик исходя из индекса в этой колонке. Можно как-то ускорить мою реализацию, я не нагуглил топовое готовое решение: https://pastebin.com/0r3LdN1g

источник

16:58пожаловаться #3

AA

Anton Alekseev in Moscow Spark

PRIVILEGES_MAPPING_# - это словарики

источник

16:59пожаловаться #4

SA

Sultanmurad Abduev in Moscow Spark

Всем привет! Правда ли что моделями из pyspark mllib лучше не пользоваться? (слышал мнение, что они устарели и вообще плохо написаны)

источник

18:04пожаловаться #5

ЕГ

Евгений Глотов... in Moscow Spark

Они дают качество хуже, чем нормальные фреймворки

источник

18:09пожаловаться #6

ЕГ

Евгений Глотов... in Moscow Spark

Сам mllib написан на rdd api, есть spark ml, то же самое, но с датафреймами и пайплайнами

источник

18:10пожаловаться #7

ЕГ

Евгений Глотов... in Moscow Spark

Плюс к нему можно пристроить плагинами нормальные фреймворки, вроде xgboost4j-spark, mmlspark, вроде даже нейросеточки

источник

18:11пожаловаться #8

ЕГ

Евгений Глотов... in Moscow Spark

Тут выше кто-то писал про pytorch on spark

источник

18:11пожаловаться #9

AZ

Alexey Zinoviev in Moscow Spark

Евгений Глотов

Они дают качество хуже, чем нормальные фреймворки

Нормальные это какие?

источник

18:16пожаловаться #10

ЕГ

Евгений Глотов... in Moscow Spark

Те, которые выигрывают кегл

источник

18:16пожаловаться #11

AZ

Alexey Zinoviev in Moscow Spark

Sultanmurad Abduev

Всем привет! Правда ли что моделями из pyspark mllib лучше не пользоваться? (слышал мнение, что они устарели и вообще плохо написаны)

Линейная регрессии и деревья устарели? Чо-то новое там придумали?

источник

18:16пожаловаться #12

ЕГ

Евгений Глотов... in Moscow Spark

Там бустинг кривой, он не зарешивает вообще

источник

18:17пожаловаться #13

AZ

Alexey Zinoviev in Moscow Spark

Sultanmurad Abduev

Всем привет! Правда ли что моделями из pyspark mllib лучше не пользоваться? (слышал мнение, что они устарели и вообще плохо написаны)

Нет, не правда, это бред. Там классический Ml, подмножество scikit-learn

источник

18:17пожаловаться #14

ЕГ

Евгений Глотов... in Moscow Spark

Сколько ни подбирай параметры, xgboost из коробки даст на 2% выше точность

источник

18:18пожаловаться #15

AZ

Alexey Zinoviev in Moscow Spark

Евгений Глотов

Сколько ни подбирай параметры, xgboost из коробки даст на 2% выше точность

Xgboost! =любой бустинг, вы же в курсе?

источник

18:18пожаловаться #16

ЕГ

Евгений Глотов... in Moscow Spark

Ок, lightgbm тоже даст точность гораздо выше, и катбуст тоже)

источник

18:19пожаловаться #17

AZ

Alexey Zinoviev in Moscow Spark

Сам фреймворк-он кривой, никто не спорит. Но алгоритмы там обычные, блин

источник

18:19пожаловаться #18

ЕГ

Евгений Глотов... in Moscow Spark

Короче, промышленные реализации моделей лучше, чем те базовые, которые реализованы в спарк мл

источник

18:20пожаловаться #19

AZ

Alexey Zinoviev in Moscow Spark

Евгений Глотов

Ок, lightgbm тоже даст точность гораздо выше, и катбуст тоже)

Конечно, блин, это продвинутые, необощенные версии бустинга.

источник

18:20пожаловаться #20