Привет, столкнулся с таким поведением спарка: есть колонка с пропусками в датафрейме, хочу её фильтрануть по условию !=2, смотрю результат: у меня дропнулись строчки не только с двойками но и с пропусками. Если фильтровать по ==2, то остаются строчки только с 2 (что логично). Баг это или фича?
Что именно меня смущает: как мне кажется, такое поведение не соответствует логике - есть закон в булевой алгебре, что x + !x =1, а тут получается, что df.filter(myCondition) и df.filter(!myCondition) при объединении не дают первоначальный датасет