Подскажите, как подступиться к задаче. Есть описание фильма, и надо проставить тэги / жанры фильмов. На основании обучающей выборки конечно. Т .е. это multi label classification, но количество жанорлв варьируется от фильма к фильму
Сделайте бинарную метку:
Триллер: 0,
Мультфильм: 1,
Мелодрама: 2
Номера жанров будут индексы в метке, Если 1, то жанр с таким индексом имеется, если 0, то не имеется. И метка будет примерно такая:
[0, 1, 1, 0, 0, ..., 0]