Size: a a a

2019 December 25

DZ

Dmitry Zuev in Moscow Spark
источник

DZ

Dmitry Zuev in Moscow Spark
вкинь драйвер в класспас
источник

ЕГ

Евгений Глотов... in Moscow Spark
KrivdaTheTriewe
когда он тысячу раз сходит и посмотрит на источник
А спарком всю таблицу качнуть сразу, не?...
источник

ЕГ

Евгений Глотов... in Moscow Spark
Или какое-то общее подмножество данных, достаточное для всех 1000 запросов
источник

K

KrivdaTheTriewe in Moscow Spark
Евгений Глотов
А спарком всю таблицу качнуть сразу, не?...
не
источник

K

KrivdaTheTriewe in Moscow Spark
не получится
источник

K

KrivdaTheTriewe in Moscow Spark
эт терадата, там размер строки не больше мега
источник

K

KrivdaTheTriewe in Moscow Spark
плюс там каст данных происходит сложный
источник

N

Nikolay in Moscow Spark
Спарк же все равно через jdbc читает
источник

K

KrivdaTheTriewe in Moscow Spark
Nikolay
Спарк же все равно через jdbc читает
важно не то что спарк читает, а как база отдает
источник

ЕГ

Евгений Глотов... in Moscow Spark
KrivdaTheTriewe
важно не то что спарк читает, а как база отдает
Качал терабайты из ТД спарком, но вот с некоторыми типами проблемы, и больших строк не было
источник

ЕГ

Евгений Глотов... in Moscow Spark
То есть ТД хранит какой-то текст в поле, но не отдаёт его по ждбц?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Или каким-то обрубком отдаёт?
источник

K

KrivdaTheTriewe in Moscow Spark
лимит в 64кб на чтение блоба и слоба в терадате
источник

K

KrivdaTheTriewe in Moscow Spark
я обошел его суперширокими вьюхами
источник

N

Nikolay in Moscow Spark
KrivdaTheTriewe
важно не то что спарк читает, а как база отдает
Скуп тоже через jdbc
источник

K

KrivdaTheTriewe in Moscow Spark
скуп не работает)
источник

K

KrivdaTheTriewe in Moscow Spark
как только начинаются блобы
источник

GP

Grigory Pomadchin in Moscow Spark
KrivdaTheTriewe
мне к сожалению нужно генерировать запросы к jdbc самому, но на 1000 запросах я тупо полтора часа драйвер жду
а ты генерируй не на драйвере, зачем тебе его ждать?
источник

K

KrivdaTheTriewe in Moscow Spark
Grigory Pomadchin
а ты генерируй не на драйвере, зачем тебе его ждать?
DataSource API
источник