А есть хоть какая-то разница для спарка - передавать переменную (условную broadcast-переменнуюв в условный mapPartitions) через аргумент или из внешнего окружения/замыкание?
А есть хоть какая-то разница для спарка - передавать переменную (условную broadcast-переменнуюв в условный mapPartitions) через аргумент или из внешнего окружения/замыкание?
Конечно. Броадкаст у тебя летает по всем нодам, а локальная переменная внутри одной jVM
Когда вы делаете broadcast, то ровным счётом ничего не происходит. Создаётся врапер на драйвере и значения никуда не летят . На экзекьюторе , когда вы используете переменную , то он ее читает с драйвера
Когда вы делаете broadcast, то ровным счётом ничего не происходит. Создаётся врапер на драйвере и значения никуда не летят . На экзекьюторе , когда вы используете переменную , то он ее читает с драйвера
а когда я ее читаю второй раз, то она уже на ноде, и драйвер уже не нужен