Телеграмм чат группы bigdata_ru страница 2330

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

4522 membersпожаловаться на группу

2020 November 16

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Как бы вы подошли к такой задаче:
У вас есть буквы с лейбелами, и слова без лейбелов.
Цель научиться читать слова. Количество букв в слове неизвестно.
То есть по идеи в данном слове нужно определить количество букв, и далее обозначить некоторый лосс как минимум суммы расстояний между каждой из букв в слове и каждой лейбированной буквой (правильное всегда совпадение уменьшит значительно эту сумму, исключение только в случае, что есть более одного варианта интерпретации структуры слова, но это только если китайский какой нибудь или бенгальский, в моем случае не думаю, что актуально).

Какие вообще подходы есть ?
Понятно, что можно просто кластеризацию на не лейблированные слова/тексты сделать, но у меня ведь есть буквы лейблированные, хотелось бы это использовать в character extraction из слова.

источник

12:11пожаловаться #1

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Как бы вы подошли к такой задаче:
У вас есть буквы с лейбелами, и слова без лейбелов.
Цель научиться читать слова. Количество букв в слове неизвестно.
То есть по идеи в данном слове нужно определить количество букв, и далее обозначить некоторый лосс как минимум суммы расстояний между каждой из букв в слове и каждой лейбированной буквой (правильное всегда совпадение уменьшит значительно эту сумму, исключение только в случае, что есть более одного варианта интерпретации структуры слова, но это только если китайский какой нибудь или бенгальский, в моем случае не думаю, что актуально).

Какие вообще подходы есть ?
Понятно, что можно просто кластеризацию на не лейблированные слова/тексты сделать, но у меня ведь есть буквы лейблированные, хотелось бы это использовать в character extraction из слова.

А можешь дать пример инпутов и желательных аутпутов твоей задачи?
Пока что постановка не очень понятна.

источник

12:12пожаловаться #2

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

есть два вида инпутов:
1. картинки букв и лейбелы
2. картинки слов без лейбелов
желанный аутпут:
лейбелы букв в картинке слова, как-то так

источник

12:13пожаловаться #3

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Капчу решаем?)

источник

12:17пожаловаться #4

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Как слово расположено в картинке? Знаем ли мы, что оно по центру (по вертикали)?

источник

12:17пожаловаться #5

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

аналогично с капчой, да, только без спец. эффектов (волнистые танцующие буквы и тд.), и расположено горизонтально.

источник

12:18пожаловаться #6

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

есть два вида инпутов:
1. картинки букв и лейбелы
2. картинки слов без лейбелов
желанный аутпут:
лейбелы букв в картинке слова, как-то так

Обычный text classification не ?. CNN

источник

12:22пожаловаться #7

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

https://youtu.be/8YsZXTpFRO0

8. Text Classification Using Convolutional Neural Networks

Follow along with Lukas to learn about word embeddings, how to perform 1D convolutions and max pooling on text.

If you want to test your knowledge try to use CNNs to improve our example project at https://github.com/lukas/ml-class/tree/master/projects/8-text-classification

Github repo: https://github.com/lukas/ml-class
See all classes: http://wandb.com/classes
Weights & Biases: http://wandb.com

источник

12:24пожаловаться #8

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

ну почти обычный по-моему, если б у меня были слова и их лейблы, тогда все просто. Надо доучить последнюю тему по object recognition

источник

12:27пожаловаться #9

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ну если есть хорошая модель, которая распознаёт буквы по одной, и мы знаем что текст не танцует и горизонтальный, то можно отрезать кусочек картинки и классифицировать его, если там буква, то переходим к следующему кусочку, если буквы нет, берем кусочек побольше

источник

12:47пожаловаться #10

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

ну почти обычный по-моему, если б у меня были слова и их лейблы, тогда все просто. Надо доучить последнюю тему по object recognition

Ну собери буквы в слова

источник

12:54пожаловаться #11

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ivan

Ну если есть хорошая модель, которая распознаёт буквы по одной, и мы знаем что текст не танцует и горизонтальный, то можно отрезать кусочек картинки и классифицировать его, если там буква, то переходим к следующему кусочку, если буквы нет, берем кусочек побольше

короче говоря сегментация. Поищу на тему unsupervised segmentation.

источник

12:56пожаловаться #12

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Evgenii Zheltonozhskii🇮🇱

Ну собери буквы в слова

тоже вариант, попробую найти что-нибудь по сегментации, задача существующая насколько гугл показывает.

источник

12:57пожаловаться #13

AC

Andrey Che in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

народ, может у кого-то есть подборка модулей для распознавания гос. номеров авто?

источник

13:25пожаловаться #14

DH

Dmytro Hrebeniuk in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

народ, может у кого-то есть подборка модулей для распознавания гос. номеров авто?

В OpenCV есть: haarcascade_licence_plate_rus_16stages.xml

источник

13:49пожаловаться #15

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

тоже вариант, попробую найти что-нибудь по сегментации, задача существующая насколько гугл показывает.

тот еще велосипед

источник

13:50пожаловаться #16

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

https://youtu.be/iKrrKyeSRew

How Do Neural Networks Memorize Text?

📝 The paper "Visualizing memorization in RNNs" is available here:
https://distill.pub/2019/memorization-in-rnns/

❤️ Pick up cool perks on our Patreon page: https://www.patreon.com/TwoMinutePapers

🙏 We would like to thank our generous Patreon supporters who make Two Minute Papers possible:
313V, Alex Haro, Andrew Melnychuk, Angelos Evripiotis, Anthony Vdovitchenko, Brian Gilman, Bruno Brito, Bryan Learn, Christian Ahlin, Christoph Jadanowski, Claudio Fernandes, Dennis Abts, Eric Haddad, Eric Martel, Evan Breznyik, Geronimo Moralez, James Watt, Javier Bustamante, John De Witt, Kaiesh Vohra, Kasia Hayden, Kjartan Olason, Levente Szabo, Lorin Atzberger, Marcin Dukaczewski, Marten Rauschenberg, Maurits van Mastrigt, Michael Albrecht, Michael Jensen, Morten Punnerud Engelstad, Nader Shakerin, Owen Campbell-Moore, Owen Skarpness, Raul Araújo da Silva, Richard Reis, Rob Rowe, Robin Graham, Ryan Monsurate, Shawn Azman, Steef, Steve Messina, Sunil Kim, Thomas Krcmar, Torsten Reil, Zach Boldyga, Zach Doty.
https://ww…

источник

13:58пожаловаться #17

K

Kamoliddin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

тоже вариант, попробую найти что-нибудь по сегментации, задача существующая насколько гугл показывает.

Посмотрите это тоже.

источник

13:58пожаловаться #18

א

אלכס in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Всем привет , как обучить catboost на датасете который не влезает в ram?

источник

22:01пожаловаться #19

YS

Yehor Smoliakov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Искать на GitHub

источник

22:07пожаловаться #20