Помогите решить задачу кластеризации. Есть набор точек рандомно разбросанных по городу. Нужно их кластеризовать таким образом, чтобы ограничить величину кластера площадью или расстоянием до центра кластера. DBSCAN и knn такого не дают
Эээ в том же питоне целая толпа библиотек и в них методов кластеризации для векторов. На сколько я помню основное различие: известно заранее количество кластеров или нет. Вам конкретные методы?
Проблема выбора количества кластеров для k-means действительно обычно решается постепенным наращиванием количества кластеров. Дальше будет нужно выбрать наилучший вариант разбиения. В Вашем случае можно сначала выбрать все варианты, удовлетворяющие условию (r<500m), а потом применить один из подходов к выбору наиболее подходящего варианта. Тут есть хорошее изложение методов выбора количества кластеров с кодом: https://towardsdatascience.com/10-tips-for-choosing-the-optimal-number-of-clusters-277e93d72d92