Телеграмм чат группы moscowspark страница 236

Господи teradata to Hadoop connector выкачал, сложил, и работай как надо тот же самый spark.read.jdbc только вид сбоку

Либо переноси логику на Терадату и дергай процедуру по jaydebeapi а конечную витрину забирай себе

источник

10:14пожаловаться #3

АЖ

Андрей Жуков... in Moscow Spark

Сюткин

Господи teradata to Hadoop connector выкачал, сложил, и работай как надо тот же самый spark.read.jdbc только вид сбоку

Либо переноси логику на Терадату и дергай процедуру по jaydebeapi а конечную витрину забирай себе

вот второй пункт вполне мысль
поди у той терадаты ресурсов на порядки больше, чем у спарка, который ее пытается выкачать

источник

10:18пожаловаться #4

С

Сюткин in Moscow Spark

Андрей Жуков

вот второй пункт вполне мысль
поди у той терадаты ресурсов на порядки больше, чем у спарка, который ее пытается выкачать

Единственное что если терадата продовская то запросы могут висеть в очереди 🤣

источник

10:18пожаловаться #5

С

Сюткин in Moscow Spark

Ну по крайней мере у нас так

источник

10:18пожаловаться #6

K

KrivdaTheTriewe in Moscow Spark

Сюткин

Господи teradata to Hadoop connector выкачал, сложил, и работай как надо тот же самый spark.read.jdbc только вид сбоку

Либо переноси логику на Терадату и дергай процедуру по jaydebeapi а конечную витрину забирай себе

он в st_geodata не умеет и блобы больше 64килобайт

источник

10:23пожаловаться #7

K

KrivdaTheTriewe in Moscow Spark

короче я spark.read просто ZIO в параллели запустил в 100 потоков и оно ускорилось в 100 раз

источник

10:24пожаловаться #8

С

Сюткин in Moscow Spark

DZ

Dmitry Zuev in Moscow Spark

KrivdaTheTriewe

короче я spark.read просто ZIO в параллели запустил в 100 потоков и оно ускорилось в 100 раз

На одной сессии?

источник

10:26пожаловаться #10

K

KrivdaTheTriewe in Moscow Spark

да

источник

10:27пожаловаться #11

DZ

Dmitry Zuev in Moscow Spark

Опять лысый всех обыграл

источник

10:28пожаловаться #12

ZM

ZLoyer Matveev in Moscow Spark

Dmitry Zuev

Опять лысый всех обыграл

не факт, мож оно в 100 раз быстрее, но кривда читает 100 раз одни и те же данные при этом

источник

10:29пожаловаться #13

DZ

Dmitry Zuev in Moscow Spark

Так вроде ж у него список запросов к тд

источник

10:31пожаловаться #14

С

Сюткин in Moscow Spark

Ну таблица то одна

источник

10:40пожаловаться #15

С

Сюткин in Moscow Spark

sticker.webp

(7.13 Кб)

источник

10:40пожаловаться #16

DZ

Dmitry Zuev in Moscow Spark

Иииии

источник

10:41пожаловаться #17

☭S

☭ ⤳ λ Shinkevich... in Moscow Spark

KrivdaTheTriewe

val load = queries
.map { x =>
UIO(unsafeExecuteSqlQuery(x.query, source))
}

def unsafeExecuteSqlQuery(query,source) = { .... spark.read.format(jdbcFormat).options(ops).load() }

А чем запросы отличаются ? Я, когда нужно было сильно распаллелить чтение из HBase генерил "миллион" префиксов (у меня rowkey - UUID, потому, к примеру, генерил от 00000 до ffffff), делал репартишн и в mapPartitions делал чтение ......

источник

10:51пожаловаться #18

GP

Grigory Pomadchin in Moscow Spark

KrivdaTheTriewe

короче я spark.read просто ZIO в параллели запустил в 100 потоков и оно ускорилось в 100 раз

ток там зио не нужно

источник

11:59пожаловаться #19

GP

Grigory Pomadchin in Moscow Spark

sticker.webp

(15.81 Кб)

источник

11:59пожаловаться #20