ок, засунули вы туда выгрузку из сейлсфорса. какие инструменты с3 предоставялет для анализа данных?
давайте без споров и уходов в сторону терминологии dwh/pentaho/hadoop и прочего. Пока в wiki написано - “A data lake is a system or repository of data stored in its natural/raw format, usually object blobs or files.” на этом все.
давайте без споров и уходов в сторону терминологии dwh/pentaho/hadoop и прочего. Пока в wiki написано - “A data lake is a system or repository of data stored in its natural/raw format, usually object blobs or files.” на этом все.
Ещё вариант: Натренировать свою модель multi label classificator на основе CNN алгоритма. Как вариант взять готовый алгоритм из AWS sage maker. Тренировать будете на размеченном датасете, например кадров по 10 из каждого ролика + жанр к ним) Потом так же и использовать: ответ модели по 10 кадрам и берём самый популярный жанр
Ещё вариант: Натренировать свою модель multi label classificator на основе CNN алгоритма. Как вариант взять готовый алгоритм из AWS sage maker. Тренировать будете на размеченном датасете, например кадров по 10 из каждого ролика + жанр к ним) Потом так же и использовать: ответ модели по 10 кадрам и берём самый популярный жанр