Size: a a a

2021 May 17

AK

Andrew Konstantinov in Moscow Spark
вcем привет! что делать с ворнингом в спарк стриминге-
WARN streaming.ProcessingTimeExecutor: Current batch is falling behind. The trigger interval is 15000 milliseconds, but spent 17817 milliseconds
источник

t

tenKe in Moscow Spark
выключить, чтобы глаза не мазолил
источник

AK

Andrew Konstantinov in Moscow Spark
так и сделаю
источник

AB

Andrey Bel in Moscow Spark
Это не может быть изза того что мощностей не хватает в положенное время переварить окно?(просто мысля -  сам работал с флинком больше)
источник

AK

Andrew Konstantinov in Moscow Spark
Ок,спасибо Andrew!)
источник

AB

Andrey Bel in Moscow Spark
не за что - возможно еще гдето ботлнек изза этого отставание -  у нас было что не успевали данные из кафки отпроцессить
источник

PK

Pavel Klemenkov in Moscow Spark
Ну что, мне кажется настало время очередного Moscow Spark. Тем более @fediq подкинул заманчивый доклад из Яндекса. Короче, объявляется call for talks, присылайте ваши темы мне в личку!
источник
2021 May 18

АА

Артем Анистратов... in Moscow Spark
Ребят, могли бы подсказать, есть ли какие либо методики тестирования нового кластера?
Интересует тест производительности и корректности работы спарка
источник

N

Nikita Blagodarnyy in Moscow Spark
запустить свои етлки. проверить, что они работают. не очень долго. запустить саентологов. собрать от них жалобы.
источник

SS

Sergey Sheremeta in Moscow Spark
раскройте что вы понимаете под "производительностью" и "корректностью", есть у вас понимание типовых профилей нагрузки (штатная, пиковая) и каких SLA вам нужно достигать под данными нагрузками (перцентили задержек ответов, длительности работы стриминговых сервисов и т.д.)
источник

SS

Sergey Sheremeta in Moscow Spark
так-то тема очень интересная! вот бы расшевелить коллег на предмет поделиться своим опытом тестирования производительности
источник

N

Nikita Blagodarnyy in Moscow Spark
мне кажется любые синтетические тесты не имеют смысла. вот залил ты power plant dataset, погонял на нем тестовые запросы, все типа норм. как это гарантирует или коррелирует с тем, что продакшон ето будет работать в заданное время?
источник

А

Алексей in Moscow Spark
Для сравнения баз между собой используют tpc-ds бенчмарк
источник

А

Алексей in Moscow Spark
в олтп системах тестируют до отказа, чтобы узнать предел возможностей. И штатную нагрузку на много часов, чтобы определить провисания со временем
источник

АА

Артем Анистратов... in Moscow Spark
Я понял, что зашел не с той стороны. Я ранее не занимался подобными вещами, поэтому какие метрики как правило используются при тестировании кластера?
В первоначальном вопросе под "производительностью" понималась скорость работы при типовой нагрузке, а так же как выше косвенно подсказали, какие синтетические тесты можно использовать для сравнения скорости на нынешнем кластере и целевом.
Под "корректностью" подразумевалась стабильность работы самого spark развернутого на кластере, есть ли какие либо "моменты", которые должны быть предусмотрены, что бы при дальнейшей эксплуатации не возникло фатальных сбоев.
источник

PK

Pavel Klemenkov in Moscow Spark
Ну так что, личка моя пуста. Все на хайлоаде что ли? )
источник

K

KrivdaTheTriewe in Moscow Spark
источник

t

tenKe in Moscow Spark
судя по погоде, на даче в огороде
источник

АЖ

Андрей Жуков... in Moscow Spark
ну хотя бы даты понятны теперь
источник

PK

Pavel Klemenkov in Moscow Spark
Если мы в онлайне, то про даты договоримся. Главное, чтоб контент был
источник