Коллеги, подскажите с просто задачей про Outliers. Есть датасет с посуточными ценами на квартиры (с AirBnB). Как правильно работать с экстремальными ценами в этом датасете?
Если использовать 3*STD или percentiles (+-IRQ), то отсекаются дорогие квартиры (а они на самом деле есть и их исключать нельзя).
Но двух картинках видно, что для Манхэттена есть две цены по 9999, это явный outlier который можно исключить так как сильно далеко от остальных да и сама цифра намекает (четыре 9ки). Но как обосновать исключение 9999, так и писать «нутром чую косяк какой то»?
И как быть с Бруклином? Там тоже несколько экстримов, но не такие явные как 9999 в Манхэттене. Как с ними быть? Исключать? И на каком основании?
Есть статья по аналогичной задаче только по моему по букингу
Запрос у меня такой body <- ('{"typesCompliance": [1], "startDate": "2019-01-21", "endDate": "2019-01-21", "isCompact": true}') r <- POST("https://api.proanalytics.net/public/v1/prices.json", body = body, content_type_json())
Все ли верно? На мой взгляд упускаю авторизацию. Обычно токен в запросе отправляют
Вот что вижу, когда запускаю собственно керас. Я так и не понял с лога, запускает это на GPU или его не находит из-за недонастроенного, как получается, cudnn и все работает на CPU