Логарифм берете, если это улучшает фит(основная причина) и как правило логарифмируются финансовые показатели, как цена квартиры, поскольку для них переход от логнормального распределения к нормальному как правило улучшает модель в том смысле, что уменьшает гетероскедастичность => правильные доверительные интервалы. Нужно только помнить, что сравнивать R^2 модели с логарифмом в левой части и модели без логарифма там неправильно.
Еще можно включать логарифмы для изменения интерпретации, если всё делается для анализа качественных результатов о влиянии факторов. Тогда речь идет о процентных изменениях переменных вместо абсолютных.
Смотреть на распределения независимых переменных и пытаться сделать их нормальными обычно не имеет смысла, поскольку, как было сказано, важно только распределение ошибок, а ваши действия его нормальность не гарантируют. Плюс если наблюдений достаточно много, то работает цпт и тогда в этом еще меньше смысла.
Где можно почитать про гетероскедастичность, overdispersion и тд? Пользовался пакетом Dharmma для валидации моих glmm, там имитируются остатки по распределению моей модели и сравниваются с эмпирическими. Хотя даже тут, возможно, я что-то не так понял. А в целом не особо понял смысол.