Size: a a a

2020 June 16

SZ

Sergey Zolotov in Kotlin JVM
We are happy to share with you the Kotlin Spark API we’ve been working on: https://github.com/JetBrains/kotlin-spark-api.

Right now it is in beta stage and we need your feedback before we create a pull request to the official Apache Spark repository.

Why Kotlin Spark API? While you can use Kotlin with the existing Apache Spark Java API, Kotlin Spark API significantly improves the developer experience. For instance, this API allows you to use such Kotlin features as data classes and lambda expressions.

On top of that Kotlin Spark API adds some helpful extension functions.
Use withCached to perform arbitrary transformations on a Dataset without it being recalculated, and don’t worry about your Dataset unpersisting at the end.
Kotlin Spark API also allows you to have unnamed tuples that you can call with c() function that takes a variable number of arguments. You can add these to one another like in Python.

Check out the Quick Start Guide to quickly set up all the needed dependencies using Maven or Gradle: https://github.com/JetBrains/kotlin-spark-api/blob/master/docs/quick-start-guide.md

Check out some code examples to get an idea of what the API looks like: https://github.com/JetBrains/kotlin-spark-api/tree/master/examples/src/main/kotlin/org/jetbrains/spark/api/examples

Try it and share your feedback with us either in #kotlin-spark, or via GitHub issues: https://github.com/JetBrains/kotlin-spark-api/issues.
источник

AN

Alexander Nozik in Kotlin JVM
Sergey Zolotov
We are happy to share with you the Kotlin Spark API we’ve been working on: https://github.com/JetBrains/kotlin-spark-api.

Right now it is in beta stage and we need your feedback before we create a pull request to the official Apache Spark repository.

Why Kotlin Spark API? While you can use Kotlin with the existing Apache Spark Java API, Kotlin Spark API significantly improves the developer experience. For instance, this API allows you to use such Kotlin features as data classes and lambda expressions.

On top of that Kotlin Spark API adds some helpful extension functions.
Use withCached to perform arbitrary transformations on a Dataset without it being recalculated, and don’t worry about your Dataset unpersisting at the end.
Kotlin Spark API also allows you to have unnamed tuples that you can call with c() function that takes a variable number of arguments. You can add these to one another like in Python.

Check out the Quick Start Guide to quickly set up all the needed dependencies using Maven or Gradle: https://github.com/JetBrains/kotlin-spark-api/blob/master/docs/quick-start-guide.md

Check out some code examples to get an idea of what the API looks like: https://github.com/JetBrains/kotlin-spark-api/tree/master/examples/src/main/kotlin/org/jetbrains/spark/api/examples

Try it and share your feedback with us either in #kotlin-spark, or via GitHub issues: https://github.com/JetBrains/kotlin-spark-api/issues.
Обещали, что вчем-то круче скалового
источник

SM

Sergey Morgunov in Kotlin JVM
Sergey Zolotov
We are happy to share with you the Kotlin Spark API we’ve been working on: https://github.com/JetBrains/kotlin-spark-api.

Right now it is in beta stage and we need your feedback before we create a pull request to the official Apache Spark repository.

Why Kotlin Spark API? While you can use Kotlin with the existing Apache Spark Java API, Kotlin Spark API significantly improves the developer experience. For instance, this API allows you to use such Kotlin features as data classes and lambda expressions.

On top of that Kotlin Spark API adds some helpful extension functions.
Use withCached to perform arbitrary transformations on a Dataset without it being recalculated, and don’t worry about your Dataset unpersisting at the end.
Kotlin Spark API also allows you to have unnamed tuples that you can call with c() function that takes a variable number of arguments. You can add these to one another like in Python.

Check out the Quick Start Guide to quickly set up all the needed dependencies using Maven or Gradle: https://github.com/JetBrains/kotlin-spark-api/blob/master/docs/quick-start-guide.md

Check out some code examples to get an idea of what the API looks like: https://github.com/JetBrains/kotlin-spark-api/tree/master/examples/src/main/kotlin/org/jetbrains/spark/api/examples

Try it and share your feedback with us either in #kotlin-spark, or via GitHub issues: https://github.com/JetBrains/kotlin-spark-api/issues.
Очень странно выглядит тот факт, что binary версия Scala не является постфиксом в имени артифакта 🤔 Очень интересно, почему отказались от этого правила?
источник

AN

Alexander Nozik in Kotlin JVM
Sergey Morgunov
Очень странно выглядит тот факт, что binary версия Scala не является постфиксом в имени артифакта 🤔 Очень интересно, почему отказались от этого правила?
пошли в слак в datascience или science все это обсуждать если интересно
источник

ПФ

Паша Финкельштейн... in Kotlin JVM
Sergey Morgunov
Очень странно выглядит тот факт, что binary версия Scala не является постфиксом в имени артифакта 🤔 Очень интересно, почему отказались от этого правила?
отвечаю как автор: мы пока работаем только с 12й скалой и 3м спарком. Как только поддержим больше  обязательно добавим ещё префиксов
источник

AN

Alexander Nozik in Kotlin JVM
Паша Финкельштейн
отвечаю как автор: мы пока работаем только с 12й скалой и 3м спарком. Как только поддержим больше  обязательно добавим ещё префиксов
Уже ответили в слаке. Приятно иметь здесь автора
источник

ПФ

Паша Финкельштейн... in Kotlin JVM
сорри, у меня почему-то чатик был замьючен, но теперь я исправился )
источник

AN

Alexander Nozik in Kotlin JVM
Паша Финкельштейн
сорри, у меня почему-то чатик был замьючен, но теперь я исправился )
Если что, в слаке каналы #science и #datascience
источник

ПФ

Паша Финкельштейн... in Kotlin JVM
Alexander Nozik
Если что, в слаке каналы #science и #datascience
там я есть, конечно )
источник

AN

Alexander Nozik in Kotlin JVM
Паша Финкельштейн
там я есть, конечно )
Меня вообще интересуют кастомные функции туда запускать. Но не знаю, когда руки дойдут всю обвязку сделать...
источник

ПФ

Паша Финкельштейн... in Kotlin JVM
Alexander Nozik
Меня вообще интересуют кастомные функции туда запускать. Но не знаю, когда руки дойдут всю обвязку сделать...
например?
источник

AN

Alexander Nozik in Kotlin JVM
У меня долгостройный проект - автоматизированная система анализа данных https://github.com/mipt-npm/dataforge-core (это текущая версия, старая лежит где-то рядом). Там суть в том, что создаются сложные графы задач для очень сложной обработки очень сложных данных. Это не совсем пэт - до недавнего времени было лучшее в мире ограничение на массу нейтрино получено. Так вот там спарк можно использовать в качестве вычислительного бэкенда
источник

AN

Alexander Nozik in Kotlin JVM
Вот старая версия - https://github.com/altavir/dataforge-old, на которой собственно достижения были
источник

ПФ

Паша Финкельштейн... in Kotlin JVM
Alexander Nozik
У меня долгостройный проект - автоматизированная система анализа данных https://github.com/mipt-npm/dataforge-core (это текущая версия, старая лежит где-то рядом). Там суть в том, что создаются сложные графы задач для очень сложной обработки очень сложных данных. Это не совсем пэт - до недавнего времени было лучшее в мире ограничение на массу нейтрино получено. Так вот там спарк можно использовать в качестве вычислительного бэкенда
так, и твой план — позвать натив из котлин-спарка?
источник

AN

Alexander Nozik in Kotlin JVM
Паша Финкельштейн
так, и твой план — позвать натив из котлин-спарка?
А зачем натив?
источник

AN

Alexander Nozik in Kotlin JVM
Я хотел скорее спарк вызвать и на него задачи распихать
источник

ПФ

Паша Финкельштейн... in Kotlin JVM
Alexander Nozik
А зачем натив?
Я так понял из "Can I call native code"
источник

ПФ

Паша Финкельштейн... in Kotlin JVM
Если я могу чем-то помочь — скажи, я с радостью
источник

AN

Alexander Nozik in Kotlin JVM
Паша Финкельштейн
Я так понял из "Can I call native code"
А, это фигня завлекательная для ретроградов. Все на котлине.
источник

AN

Alexander Nozik in Kotlin JVM
Я просто не знаю, когда к этому вернусь.
источник