Size: a a a

R (язык программирования)

2020 June 13

A

Andrey in R (язык программирования)
Юрий 🐙💻🤖📊📈🚬
#опрос #лайфхаки Друзья, опрос на свободную тему: чему научились в R за последнее время, какие пакеты для себя открыли? Какие задачи смогли решить средствами R, а что пока не удалось сделать (найти решение)?
mlr3, sparklyr, tidymodels
источник

IS

Ivan Struzhkov in R (язык программирования)
Alexey Burnakov
В вот ещё тема. Значит, проходите вы скрининг в booking.com. на вопрос даются ответы, надо выбрать один. Далее напишу вопрос. Ответов не знаю.
Вообще если строго подоходить к вопросу - то ничего мне кажется не подходит.
Созвездие не мера растояния. к-средние распределят звезды по растоянию к n выбранных центройдов. При этом если качество модели измерять на процент ложных срабатываний (а на небе есть звезды которые не входят в созвездия)
То ошибка будет большой

Так же есть проблема с тем, что созведия не объязательно плотная группа. И не объязательно в форме окружности и неизвестно какое количество создведий реально видно на фотографии

На мой взгляд реальное решение задачи выглядело бы так -  
распознаем звезды (вот он kmeans где как раз )
Кластеризуем звезды по яркости
Находим относительные угловые растояния пар самых ярких звезд в известных создведиях
Ищем угловые растояния на фотографии для всех пар
По ориентации достариваем граф известного созведия
Для каждый звезды проверяем входит ли она в граф и в какой входит
источник

IS

Ivan Struzhkov in R (язык программирования)
Наверное можно даже снять требование уникальности углового растояния, если выявить массив нескольких пар звезд с одной общей звездой
источник

IS

Ivan Struzhkov in R (язык программирования)
Навеерное даже граф можно не строить
источник

IS

Ivan Struzhkov in R (язык программирования)
после распознавания самих звезд и класификации по яркости, имея на руках справочник известных созвездий - задача становиться чисто алгоритмической. Никакое машиное обучение не нужно - нужно просто хорошо сделать две таблицы и найти наиболее близкие значения.

Так находится точка созвездия. Если нужно класифицировать сами звезды - стоим граф 360 раз смещая на один градус - выбирая самый лучший результ по сравнению с эталоном
источник

AB

Alexey Burnakov in R (язык программирования)
Ivan Struzhkov
после распознавания самих звезд и класификации по яркости, имея на руках справочник известных созвездий - задача становиться чисто алгоритмической. Никакое машиное обучение не нужно - нужно просто хорошо сделать две таблицы и найти наиболее близкие значения.

Так находится точка созвездия. Если нужно класифицировать сами звезды - стоим граф 360 раз смещая на один градус - выбирая самый лучший результ по сравнению с эталоном
Интересные рассуждения. Там можно указать Другой вариант. Только потом вряд ли будут просить пояснить.
источник

AB

Alexey Burnakov in R (язык программирования)
Там 6 стадий, это 2я
источник

IS

Ivan Struzhkov in R (язык программирования)
Ну вообще мне кажется что это прям ловушка
источник

IS

Ivan Struzhkov in R (язык программирования)
и kmeans и knn - прям неподходят
источник

AB

Alexey Burnakov in R (язык программирования)
Ну если из 12 одну сделать неверно это хороший результат
источник

IS

Ivan Struzhkov in R (язык программирования)
я сомневаюсь что даже так получится
источник

IS

Ivan Struzhkov in R (язык программирования)
я при этой задаче представляю себе кусок звездного неба
источник

AB

Alexey Burnakov in R (язык программирования)
Ivan Struzhkov
и kmeans и knn - прям неподходят
knn можно натянуть. Если наложить кальку с картой на фото неба (с нужными искажениями)
источник

IS

Ivan Struzhkov in R (язык программирования)
а как эту кальку наложить?
источник

IS

Ivan Struzhkov in R (язык программирования)
фотография может быть любого машстаба и повернута как угодно?
источник

AB

Alexey Burnakov in R (язык программирования)
Хороший вопрос)
источник

AB

Alexey Burnakov in R (язык программирования)
Может, трактовать knn как результат оптимизации накладывания кальки
источник

IS

Ivan Struzhkov in R (язык программирования)
я не очень понимаю просто формальную постановку применения knn
источник

AB

Alexey Burnakov in R (язык программирования)
А вот кластеризация тут точно будет плавать
источник

IS

Ivan Struzhkov in R (язык программирования)
knn никак не будет
источник