Size: a a a

2021 February 04

K

KrivdaTheTriewe in Moscow Spark
Если не найдете, напомните через час я посмотрю
источник

D

Dmitry in Moscow Spark
KrivdaTheTriewe
Посмотрите секцию конфигурейшн документации, там прям есть то что вы ищите , в апп мастере
Огонь, спасибо!

spark.redaction.regex

кажется, то, что надо
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Dmitry
предполагается, что имеется доступ к ui-ям, коду / бинарным артефактам (джарники, типа). Хотя в моем случае  конкретно речь про питон, но, кажется, это ничего принципиально не меняет.
Тогда шифрование с помощью git-secret, доступ только у доверенных сотрудников с разрешёнными gpg ключами и у билд-сервера
источник

D

Dmitry in Moscow Spark
Паша Финкельштейн
Тогда шифрование с помощью git-secret, доступ только у доверенных сотрудников с разрешёнными gpg ключами и у билд-сервера
А я правильно понимаю, что оно в таком сеттинге submit'у передается уже расшифрованное, а значит, будет где-то светить на том же hdfs-е (или как оно делает? всмысле чтобы раздать файлы / джарники ярну)
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Dmitry
А я правильно понимаю, что оно в таком сеттинге submit'у передается уже расшифрованное, а значит, будет где-то светить на том же hdfs-е (или как оно делает? всмысле чтобы раздать файлы / джарники ярну)
Так броадкаст же. Из памяти всегда можно вытащить всякое чувствительное. Если хранить в чём-то сетевом - то оттуда и экзекьюторы могут читать, собранные ровно в том же сеттинге. Но если есть доступ к hdfs - то да, можно будет стащить ключ и прочитать самому
источник

K

KrivdaTheTriewe in Moscow Spark
Паша Финкельштейн
Так броадкаст же. Из памяти всегда можно вытащить всякое чувствительное. Если хранить в чём-то сетевом - то оттуда и экзекьюторы могут читать, собранные ровно в том же сеттинге. Но если есть доступ к hdfs - то да, можно будет стащить ключ и прочитать самому
Ну это уже костыль
источник

K

KrivdaTheTriewe in Moscow Spark
Вернее колхоз
источник

K

KrivdaTheTriewe in Moscow Spark
С тем же успехом можно на хдфс положить данные и настроить права доступа к ним
источник

ПФ

Паша Финкельштейн... in Moscow Spark
KrivdaTheTriewe
Ну это уже костыль
Я не вижу абсолютно секьюрного решения. Спрятать что-то из морды - защита слабее чем не иметь этого нигде в незашифрованном виде
источник

D

Dmitry in Moscow Spark
я, кажется, криво выразился. Вот, допустим, в джарнике лежит все расшифрованное, к джарнику, допустим ограниченный доступ. Вызываем spark-submit на этот джарник. Чтобы этот джарник раскидался на драйвер (cluster mode) и экзекьюторы, оно ведь кладется перед этим в hdfs? или какой-то дистрибьютед кеш
источник

D

Dmitry in Moscow Spark
Паша Финкельштейн
Так броадкаст же. Из памяти всегда можно вытащить всякое чувствительное. Если хранить в чём-то сетевом - то оттуда и экзекьюторы могут читать, собранные ровно в том же сеттинге. Но если есть доступ к hdfs - то да, можно будет стащить ключ и прочитать самому
^ к этому сообщению)
источник

K

KrivdaTheTriewe in Moscow Spark
Dmitry
я, кажется, криво выразился. Вот, допустим, в джарнике лежит все расшифрованное, к джарнику, допустим ограниченный доступ. Вызываем spark-submit на этот джарник. Чтобы этот джарник раскидался на драйвер (cluster mode) и экзекьюторы, оно ведь кладется перед этим в hdfs? или какой-то дистрибьютед кеш
В хдфс кладется
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Dmitry
я, кажется, криво выразился. Вот, допустим, в джарнике лежит все расшифрованное, к джарнику, допустим ограниченный доступ. Вызываем spark-submit на этот джарник. Чтобы этот джарник раскидался на драйвер (cluster mode) и экзекьюторы, оно ведь кладется перед этим в hdfs? или какой-то дистрибьютед кеш
Да, конечно кладётся.
источник

D

Dmitry in Moscow Spark
Ага, кайф, т.е. без acl нормального на hdfs не обойтись
источник

ПФ

Паша Финкельштейн... in Moscow Spark
А мне кажется что без этого всё равно очень плохо.
источник

ПФ

Паша Финкельштейн... in Moscow Spark
С полным доступом очень легко всё украсть
источник

K

KrivdaTheTriewe in Moscow Spark
Dmitry
Ага, кайф, т.е. без acl нормального на hdfs не обойтись
Пока керберезации не будет, кластер голый король
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Идея с прятанием из морды даёт просто на один слой меньше защиты
источник

D

Dmitry in Moscow Spark
У нас, блин, бзера через HADOOP_USERNAME можно проставить 🤦  и вперед
источник

K

KrivdaTheTriewe in Moscow Spark
Dmitry
У нас, блин, бзера через HADOOP_USERNAME можно проставить 🤦  и вперед
Именно
источник