Вот изначально в сторону SageMaker'a и смотрела, на самом деле, но в первую очередь стоял вопрос снижения цены. Встречались примеры архитектур, в которых были использованы лямбды как триггеры для обработки запросов
Они подходят, но когда нет gpu. Вам же пользователю нужен быстрый ответ. А пока лямбда вызовет и поднимет кого-то с gpu ...
вот если бы без gpu, то lambda хороший вариант