Я не использовал tuckey hsd раньше, но быстрое гугление показывает, что этот тест используют для попарных сравнений нескольких групп.
Н-р, если у вас было 5 терапией и потом вы хотите сравнить A и Б, А и В, А и Г, Б и В и так далее.
В вашем случае, как я понял другая задача: нужно выбрать лучшую фичу из нескольких. Для начала хотелось бы понять, что у вас в качестве предиктора используется, а то вы так резко хи-квадрат хотите использовать :)
можно использовать разные поправки на множественные сравнения, основная логика: сначала получаете серию p-value (т.е. стоите НЕСКОЛЬКО моделей, н-р для каждого предиктора отдельно либо суете все в одну модель, и берете pvalue отдельно для каждого предиктора), потом делаете поправку любым из способов (да хоть Бонферрони, но он слишком консервативный).
Затем после поправки будет видно, какие кредиторы остались значимыми. Сравнивать результаты по размеру p-value особо смысла нет. Т.е. если для одного предиктора оказалось 0.123, а для другого 0.789, то нельзя говорить, что 0.123 лучше. Все равно они оба получились незначимыми