так это почти невозможно, т.к. самое понимание "правильно" и "не правильно" может сильно зависеть от контекста и в принципе динамически меняться, можно придумать довольно много конфликтных сценариев, и это даже у простой ситукции когда выходных вариантов всего 2, что встречается крайне редко (если мы говорим о каких-то более-менее сложны процессах)
в принципе проблема фиксится, через p-value, но тогда не будет "правильных" и "не правильных" результатов, будет результат про который можно сказать что менее вероятно что он не правильный