Size: a a a

2020 December 28

ПФ

Паша Финкельштейн... in Moscow Spark
хммм
источник

ПФ

Паша Финкельштейн... in Moscow Spark
блин
источник

С

Сюткин in Moscow Spark
Просто отключить ссылки и картинки всем
источник

С

Сюткин in Moscow Spark
источник

А

Алексей in Moscow Spark
никто не сталкивался с тем, что spark 2.3 с 1 worker не загружает больше 4294967295 строк из mssql ?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Алексей
никто не сталкивался с тем, что spark 2.3 с 1 worker не загружает больше 4294967295 строк из mssql ?
какая интересная цифра. 42 миллиарда… Я сначала подумал что это типа диапазон инта, но нет
источник

ПФ

Паша Финкельштейн... in Moscow Spark
А, 4 миллиарда!
источник

А

Алексей in Moscow Spark
Паша Финкельштейн
какая интересная цифра. 42 миллиарда… Я сначала подумал что это типа диапазон инта, но нет
2³² - 1
источник

А

Алексей in Moscow Spark
да, похоже на это, но неужели ограничение спарка? или всеже гдето в другом еще может?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Алексей
да, похоже на это, но неужели ограничение спарка? или всеже гдето в другом еще может?
ну да, скорее всего ограничение спарка
источник

ПФ

Паша Финкельштейн... in Moscow Spark
явно же 32-битный инт
источник

А

Алексей in Moscow Spark
не нахожу в гугле, чтоб ктото еще с такой проблемой сталкивался - это странно
источник

А

Алексей in Moscow Spark
вообще странное поведение, потому что spark не выводит ошибок, говорит, ОК, я все загрузил, а по факту строк больше.
посмотреть бы на этот участок кода, возможно уже пофиксили после 2.3
источник

ПФ

Паша Финкельштейн... in Moscow Spark
О, а может это драйвер? Типа spark-jdbc изначально всё в массив вычитывает, например
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Что мускуль говорит, какой в него запрос приезжает?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
С массивом не может быть, он только неотрицательными числами индексируется
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Что будет если вычитать четыре миллиарда и заюнионить с ещё 4 миллиардами?
источник

А

Алексей in Moscow Spark
может быть и драйвер, точней пока проверить не могу. Как workaround решил разбить выемку данных на 4 таска со своим предикатом фильтрации
источник

А

Алексей in Moscow Spark
если было бы переполнение unsigned int, то поидее spark должен был кинуть исключение
источник

t

tenKe in Moscow Spark
Алексей
никто не сталкивался с тем, что spark 2.3 с 1 worker не загружает больше 4294967295 строк из mssql ?
Сколько элементов на партицию у тебя на выходе должно получиться?
источник