Ну в моём случае аутлаеры это то, что далеко от общей массы в силу ошибок в данных или в силу экстремального случая.
в идеальном случае определение должно помогать сформулировать различительный критерий %) в частности, чем очень дорогая квартира отличается от аутлаера.
например, ошибки в данных можно операционализировать как стоимость из нескольких повторений одной цифры, типа 9999. или нарушение закона бенфорда, например.
вообще, подходов много к выделению аутлаеров. и кластеризации на любой вкус, пороги-квантили, и что угодно еще. тут важно просто выбрать какой-то, аргументация подхода всегда предмет споров, на мой взгляд. я лично предпочитаю процентили, как выше писал.