Знаете как можно заставить нейронку узнавать какие-то объекты и предметы?
Допустим, вы хотели бы узнавать на каждой фотографии «газовый ключ разводной» – ну допустим. Вы готовите набор данных из тысяч фотографий где находятся гаечные ключи, что само по себе сложно, потому что их придется где-то найти.
Ну допустим вы справились с этой задачей, теперь самое сложное – вам нужно на каждой фотографии обвести рамкой где именно газовый ключ находится на фото, чтобы нейронка знала что искать – это сложно, долго и неимоверно скучно.
Пройдя все эти этапы вы сможете научить какой-нибудь алгоритм (например Yolo) узнавать разводные ключи на любой фотографии – поздравляю, вы прекрасны.
Но есть еще один подход, который в ML индустрии звучит как:
Unsupervised Classification.
Он намного сложнее – вы просто скармливаете тысячи картинок нейронке, ничего не размечаете, она пыхтит сравнивая все картинки между собой сложными способами и в итоге возвращает вам группы картинок, на которых по ее мнению изображено «одно и то же».
Вам же остается только найти где же там «разводные ключи» и подписать их.
Это сложная и классная ML задача и я не могу нарадоваться, что помимо того, что код такой нейронки опубликовали на гитхабе – она в данный момент считается самой лучшей в этой области:
https://github.com/wvangansbeke/Unsupervised-ClassificationТак еще для ML-инженеров есть детальный разбор того как она устроена на английском:
https://youtu.be/hQEnzdLkPj4В общем, если вы в теме, вам понравится ✨