Друзья, давайте на этой неделе поговорим про продактов для Machine Learning продуктов: кто это такие, зачем нужны, как стать одним из них 😁 присылайте ваши вопросы через
эту ссылку или мне в личку
@Anna_Boo!
Я работала с одной из команд в Яндекс Поиске; а последние два года руковожу AI командами в Facebook Workplace. Особенность этой должности - в большой вариативности технологий, которые мы используем: начиная с классического ранжирования и рекомендательных систем и заканчивая speech recognition, image recognition, conversational AI и так далее.
Один из самых популярных вопросов – а зачем вообще нужен ML продакт, если есть техлид и мощная команда инженеров. Давайте разберем на примерах.
Пример 1: мы хотим сделать рекомендации продуктов на Амазоне.
1) Какую проблему мы решаем/ какую цель мы преследуем? Хотим ли мы увеличить разнообразие товаров, на которые смотрит пользователь? Хотим ли мы напомнить о товарах, которые скоро закончатся у пользователя? Хотим ли мы увеличить количество товаров в корзине ("не забудьте купить батарейку для своего нового радио")?
2) В каком контексте находится пользователь? Просто от скуки исследует ассортимент? Выбирает товар из определенной категории? Или пришел за конкретной вещью?
3) Какие данные мы можем и хотим использовать? Контекстуальные ("пользователь находится в определенной точке user journey") или основанные на его профиле ("мужчина, 20 лет, Франция, интересуется Star Wars и балетом")? Как мы можем предоставить наилучшие рекомендации, при этом забочась об этике и user privacy? Каким образом мы можем получить данные, если их пока нет в системе?
4) От кого эти рекомендации приходят? От группы экспертов? От таких же пользователей, как и наш юзер?
5) От пунктов выше будет зависеть интерфейс: как мы презентуем рекомендации, какой инпут требуется от пользователя, и какой контроль мы ему предоставляем над конечным результатом.
Я наверняка сейчас что-то забыла, но эти 5 вопросов - абсолютный минимум, на который надо ответить. Заметьте, наша работа над самим алгоритмом еще даже не началась!
Пример 2: мы хотим ранжировать посты в ленте Twitter.
Наши шаги здесь не будут сильно отличаться от примера 1, но я хочу подробнее разобрать пункт 1 - какая наша цель. Подобные алгоритмы обычно ранжируют результаты на основе вероятностей: например, для поста X вероятность, что я оставлю комментарий, выше, чем для поста Y, поэтому X будет на первом месте, а Y на втором. Вопрос в том, вероятность чего мы предсказываем, и какой у этого будет долгосрочный эффект.
Хотим ли мы предсказывать p(комментарий)? Или р(поделиться твитом)? Или р(совокупность каких-то действий)? По сути, то, что мы предсказываем, - это выражение ценности для пользователя. Задача продакта - определить, что же является этой ценностью.
Вторая сложность - долгосрочные эффекты. Например, мы выбрали p(комментарий) как нашу цель, но из-за этого, например, мы начали поднимать наверх более агрессивные дискуссии на политические темы. В краткросрочной перспективе комментарии растут, так как пользователи вовлекаются в эти дискуссии, может, даже начинают сами делать такие посты, но через несколько месяцев осознают, что Твиттер приносит им негативные эмоции, и уходят с платформы. Задача продакта – продумать последствия для экосистемы, понять риски и возможные biases.
В общих чертах, ML продакт занимается тем же, чем и обычный продакт: исследует рынок, думает про проблемы и ценность для пользователей, разрабатывает стратегию. Но в контексте ML это становится еще более критично, так как любая работа над ML занимает в разы больше времени, чем обычная продуктовая разработка, и требует множество итераций. Также, так как сфера довольно инновационная, у инженеров больше соблазнов опробовать какие-то новые технологические подходы, а не решить проблему пользователя/бизнеса 😉 как обычно, продакт помогает команде использовать ресурс с наилучшим КПД (а иногда и решить, что ML здесь не нужен).
В следующей части поговорим про необходимые навыки и образование для ML продакта.
@proproduct