Size: a a a

2020 June 02

NN

No Name in Moscow Spark
Pavel Klemenkov
Этого достаточно )
Приятно, когда есть темы, в которых ты достаточно прошарен)
источник

GP

Grigory Pomadchin in Moscow Spark
Евгений Глотов
Мы со своим пакетом)
Бич пакетом?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Не, я имею в виду ноду с оперативой)
источник

PK

Pavel Klemenkov in Moscow Spark
Ваще канеш ржака была, когда в кейноуте на Спарк саммите создатель scikit-learn показал результаты опросов дата сатанистов, типа с каким размером датасетов вы работаете. И там уверенная такая медиана где в 10гб была
источник

PK

Pavel Klemenkov in Moscow Spark
Нахер этот Спарк, спрашивается? )
источник

GP

Grigory Pomadchin in Moscow Spark
Pavel Klemenkov
Ваще канеш ржака была, когда в кейноуте на Спарк саммите создатель scikit-learn показал результаты опросов дата сатанистов, типа с каким размером датасетов вы работаете. И там уверенная такая медиана где в 10гб была
это кстати самый большой пойнт
источник

NN

No Name in Moscow Spark
Pavel Klemenkov
Ваще канеш ржака была, когда в кейноуте на Спарк саммите создатель scikit-learn показал результаты опросов дата сатанистов, типа с каким размером датасетов вы работаете. И там уверенная такая медиана где в 10гб была
Так чтоб им этот датасет в 10 Гб собрать, подчас надо несколько теров перелопатить со всякой экзотической логикой) это, мб, больше про ненужность мллиб, хотя я тут не в теме.
источник

ЕГ

Евгений Глотов... in Moscow Spark
Pavel Klemenkov
Ваще канеш ржака была, когда в кейноуте на Спарк саммите создатель scikit-learn показал результаты опросов дата сатанистов, типа с каким размером датасетов вы работаете. И там уверенная такая медиана где в 10гб была
Не знаю, кого они спрашивали, у нас саентисты достаточно часто поднимают с360 за три года, по 20 гигов орка в день)
источник

PK

Pavel Klemenkov in Moscow Spark
No Name
Так чтоб им этот датасет в 10 Гб собрать, подчас надо несколько теров перелопатить со всякой экзотической логикой) это, мб, больше про ненужность мллиб, хотя я тут не в теме.
Дата инженеры достаточно круты, чтоб херачить чистый мапредьюс. На баше )
источник

PK

Pavel Klemenkov in Moscow Spark
Евгений Глотов
Не знаю, кого они спрашивали, у нас саентисты достаточно часто поднимают с360 за три года, по 20 гигов орка в день)
Поднимать-то поднимают, а работают-то они с чем?)
источник

NN

No Name in Moscow Spark
Pavel Klemenkov
Дата инженеры достаточно круты, чтоб херачить чистый мапредьюс. На баше )
Да я вам на бейсике такие пайплайны нарисую!
источник

ЕГ

Евгений Глотов... in Moscow Spark
Pavel Klemenkov
Поднимать-то поднимают, а работают-то они с чем?)
Да не, они у нас не работают, только 300к/сек получают
источник

ЕГ

Евгений Глотов... in Moscow Spark
источник

PK

Pavel Klemenkov in Moscow Spark
No Name
Да я вам на бейсике такие пайплайны нарисую!
Вот это разговор. А то жжете киловатты и килобаксы в облаках, а сатанисту одной тачки хватает. Да и одного ядра в случае пандаса
источник

PK

Pavel Klemenkov in Moscow Spark
источник

T

T in Moscow Spark
Grigory Pomadchin
Милион в час стоят
да брось на спот инстансах достаточно дешово выходит
источник

NN

No Name in Moscow Spark
Pavel Klemenkov
Вот это разговор. А то жжете киловатты и килобаксы в облаках, а сатанисту одной тачки хватает. Да и одного ядра в случае пандаса
Ну все, ща в сайнтисты пойду, ядро шатать.
источник

T

T in Moscow Spark
мы регулярно на r5.24 гоняем
источник

AS

Andrey Smirnov in Moscow Spark
20 это не запредельно, не 128 же :)
источник

PK

Pavel Klemenkov in Moscow Spark
T
да брось на спот инстансах достаточно дешово выходит
Спарк в спот инстансах? Это только для сильных!
источник