Size: a a a

2020 June 16

DZ

Dmitry Zuev in Moscow Spark
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Dmitry Zuev
как компоузить два заперсищеных дс?
Смотря как делал. Я бы сказал a.withCached { b.withCached {} }
источник

M

Mi in Moscow Spark
Паша Финкельштейн
Привет всем!
Мы рады представить Spark API для Kotlin, над которым мы долгое время работали: https://github.com/JetBrains/kotlin-spark-api.

Сейчас API находится на стадии beta-тестирования, но мы планируем сделать PR в официальный репозиторий Apache Spark, поэтому нам очень нужен фидбек, чтобы PR отражал не только наше понимание того, что нужно, но также учитывал пожелания конечных пользователей.

Чем хорош Kotlin Spark API? Хотя вы уже давно можете использовать Java API из Kotlin, Kotlin Spark API даёт вам доступ к API, более напоминающий Scala, чем Kotlin, а также даёт вам использовать удобные штуки типа дата классов и лямбд.

Кроме того, Kotlin Spark API добавляет несколько удобных extension функций вроде withCached, которая даёт вам возможность вызывать произвольные конвейеры обработки на датасете без необходимости несколько раз пересчитывать данные, а также без страха забыть вызвать на этих данных unpersist.
Kotlin Spark API добавляет возможность работать с неименованными кортжами с помощью функции c(). Более того, их даже можно складывать как в Python!

Посмотреть quick start с использованием Maven или Gradle можно тут: https://github.com/JetBrains/kotlin-spark-api/blob/master/docs/quick-start-guide.md

А несколько разнообразных примеров использования тут: https://github.com/JetBrains/kotlin-spark-api/tree/master/examples/src/main/kotlin/org/jetbrains/spark/api/examples

Попробуйте и поделитесь своим мнением с нами в канале #kotlin-spark, или в GitHub Issues: https://github.com/JetBrains/kotlin-spark-api/issues.
можно переслать это ребятам в новостной канал по котлину?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Mi
можно переслать это ребятам в новостной канал по котлину?
Конечно, а это где? Я тоже хочу посмотреть!
источник

M

Mi in Moscow Spark
источник

DZ

Dmitry Zuev in Moscow Spark
Паша Финкельштейн
Смотря как делал. Я бы сказал a.withCached { b.withCached {} }
а как вернуть новый дс? какой там возвращаемый тип должен быть?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Dmitry Zuev
а как вернуть новый дс? какой там возвращаемый тип должен быть?
А withCached возвращает дженерик
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Можно вернуть новый датасет, можно вернуть циферку или вообще ничего не возвращать (Unit)
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Да, давай перешлём конечно
источник

M

Mi in Moscow Spark
я уже написал основателю канала)
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Mi
я уже написал основателю канала)
Спасибо!
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Паша Финкельштейн
Привет всем!
Мы рады представить Spark API для Kotlin, над которым мы долгое время работали: https://github.com/JetBrains/kotlin-spark-api.

Сейчас API находится на стадии beta-тестирования, но мы планируем сделать PR в официальный репозиторий Apache Spark, поэтому нам очень нужен фидбек, чтобы PR отражал не только наше понимание того, что нужно, но также учитывал пожелания конечных пользователей.

Чем хорош Kotlin Spark API? Хотя вы уже давно можете использовать Java API из Kotlin, Kotlin Spark API даёт вам доступ к API, более напоминающий Scala, чем Kotlin, а также даёт вам использовать удобные штуки типа дата классов и лямбд.

Кроме того, Kotlin Spark API добавляет несколько удобных extension функций вроде withCached, которая даёт вам возможность вызывать произвольные конвейеры обработки на датасете без необходимости несколько раз пересчитывать данные, а также без страха забыть вызвать на этих данных unpersist.
Kotlin Spark API добавляет возможность работать с неименованными кортжами с помощью функции c(). Более того, их даже можно складывать как в Python!

Посмотреть quick start с использованием Maven или Gradle можно тут: https://github.com/JetBrains/kotlin-spark-api/blob/master/docs/quick-start-guide.md

А несколько разнообразных примеров использования тут: https://github.com/JetBrains/kotlin-spark-api/tree/master/examples/src/main/kotlin/org/jetbrains/spark/api/examples

Попробуйте и поделитесь своим мнением с нами в канале #kotlin-spark, или в GitHub Issues: https://github.com/JetBrains/kotlin-spark-api/issues.
@pklemenkov а может быть ты закрепишь? Чтобы побольше люде увидело? Очень адоптеры нужны
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Спасибо!
источник

N

Nikolay in Moscow Spark
Какой страх забыть вызвать unpersist?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Nikolay
Какой страх забыть вызвать unpersist?
Есть мнение что persist сжирает место, которое может понадобиться для чего-то ещё. По крайней мере я такое от народа слышал
источник

GP

Grigory Pomadchin in Moscow Spark
Dmitry Zuev
а как вернуть новый дс? какой там возвращаемый тип должен быть?
у них нет типов нормальных
источник

N

Nikolay in Moscow Spark
Интересно чем тот народ объясняет это страх
источник

N

Nikolay in Moscow Spark
Это место на диски или в памяти ?
источник

GP

Grigory Pomadchin in Moscow Spark
Nikolay
Интересно чем тот народ объясняет это страх
когда вызываешь персист оно дублирует дату на последующих операциях
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Grigory Pomadchin
у них нет типов нормальных
В смысле?
источник