Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2020 November 16

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Как бы вы подошли к такой задаче:
У вас есть буквы с лейбелами, и слова без лейбелов.
Цель научиться читать слова. Количество букв в слове неизвестно.
То есть по идеи в данном слове нужно определить количество букв, и далее обозначить некоторый лосс как минимум суммы  расстояний между каждой из букв в слове и каждой лейбированной буквой (правильное всегда совпадение уменьшит значительно эту сумму, исключение только в случае, что есть более одного варианта интерпретации структуры слова, но это только если китайский какой нибудь или бенгальский, в моем случае не думаю, что актуально).

Какие вообще подходы есть ?
Понятно, что можно просто кластеризацию на не лейблированные слова/тексты сделать, но у меня ведь есть буквы лейблированные, хотелось бы это использовать в character extraction из слова.
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
Как бы вы подошли к такой задаче:
У вас есть буквы с лейбелами, и слова без лейбелов.
Цель научиться читать слова. Количество букв в слове неизвестно.
То есть по идеи в данном слове нужно определить количество букв, и далее обозначить некоторый лосс как минимум суммы  расстояний между каждой из букв в слове и каждой лейбированной буквой (правильное всегда совпадение уменьшит значительно эту сумму, исключение только в случае, что есть более одного варианта интерпретации структуры слова, но это только если китайский какой нибудь или бенгальский, в моем случае не думаю, что актуально).

Какие вообще подходы есть ?
Понятно, что можно просто кластеризацию на не лейблированные слова/тексты сделать, но у меня ведь есть буквы лейблированные, хотелось бы это использовать в character extraction из слова.
А можешь дать пример инпутов и желательных аутпутов твоей задачи?
Пока что постановка не очень понятна.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
есть два вида инпутов:
1. картинки букв и лейбелы
2. картинки слов без лейбелов
желанный аутпут:
лейбелы букв в картинке слова, как-то так
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Капчу решаем?)
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Как слово расположено в картинке? Знаем ли мы, что оно по центру (по вертикали)?
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
аналогично с капчой, да, только без спец. эффектов (волнистые танцующие буквы и тд.), и расположено горизонтально.
источник

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
есть два вида инпутов:
1. картинки букв и лейбелы
2. картинки слов без лейбелов
желанный аутпут:
лейбелы букв в картинке слова, как-то так
Обычный text classification не ?. CNN
источник

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ну почти обычный по-моему, если б у меня были слова и их лейблы, тогда все просто. Надо доучить последнюю тему по object recognition
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ну если есть хорошая модель, которая распознаёт буквы по одной, и мы знаем что текст не танцует и горизонтальный, то можно отрезать кусочек картинки и классифицировать его, если там буква, то переходим к следующему кусочку, если буквы нет, берем кусочек побольше
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
ну почти обычный по-моему, если б у меня были слова и их лейблы, тогда все просто. Надо доучить последнюю тему по object recognition
Ну собери буквы в слова
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ivan
Ну если есть хорошая модель, которая распознаёт буквы по одной, и мы знаем что текст не танцует и горизонтальный, то можно отрезать кусочек картинки и классифицировать его, если там буква, то переходим к следующему кусочку, если буквы нет, берем кусочек побольше
короче говоря сегментация. Поищу на тему unsupervised segmentation.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Evgenii Zheltonozhskii🇮🇱
Ну собери буквы в слова
тоже вариант, попробую найти что-нибудь по сегментации, задача существующая насколько гугл показывает.
источник

AC

Andrey Che in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
народ, может у кого-то есть подборка модулей для распознавания гос. номеров авто?
источник

DH

Dmytro Hrebeniuk in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Andrey Che
народ, может у кого-то есть подборка модулей для распознавания гос. номеров авто?
В OpenCV есть: haarcascade_licence_plate_rus_16stages.xml
источник

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
тоже вариант, попробую найти что-нибудь по сегментации, задача существующая насколько гугл показывает.
тот еще велосипед
источник

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
тоже вариант, попробую найти что-нибудь по сегментации, задача существующая насколько гугл показывает.
Посмотрите это тоже.
источник

א

אלכס in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Всем привет , как обучить catboost на датасете который не влезает в ram?
источник

YS

Yehor Smoliakov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Искать на GitHub
источник