А что народ думает про логистическую регрессию со смешанными эффектами, которую запустили на несбалансированных данных (92% к 8%, 2000 наблюдений)...
наверное самое простое, это 2000 наблюдений это генеральная совокупность или выборка?
если первое, и данные такие и есть, никаких смещений быть не могло. то делайте что хотите.
Если выборка, то мне кажется, нужен какой-то другой метод анализа. Но это надо погуглить статьи по биостатистике или экологии может. Там у них часто данные несбалансированные и выборки.