Телеграмм чат группы aws_ru страница 3155

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

AWS_RU

1716 membersпожаловаться на группу

2020 August 28

AT

Al T in AWS_RU

Всем привет, у меня есть вопрос относительно sagemaker’a с лямбдами. Передо мной стоит задача обращения к модели, которая работает только на GPU (трансформер, работа с текстом), но постоянно держать поднятым инстанс очень не хочется. Есть ли у AWS какая-то опция для того, чтобы обрабатывать запросы только при обращении, в смысле, вести расчёты и тратить деньги?

ну вот только это пока есть - https://aws.amazon.com/ru/machine-learning/elastic-inference/ не совсем то что вам надо, понимаю, но чем богаты...

Amazon Web Services, Inc.

Amazon Elastic Inference - Amazon Web Services

источник

12:27пожаловаться #1

SZ

Sasha Zhu in AWS_RU

Al T

ну вот только это пока есть - https://aws.amazon.com/ru/machine-learning/elastic-inference/ не совсем то что вам надо, понимаю, но чем богаты...

Amazon Web Services, Inc.

Amazon Elastic Inference - Amazon Web Services

Спасибо, посмотрю!

источник

12:27пожаловаться #2

SZ

Sasha Zhu in AWS_RU

А вообще, может быть может кто-то подсказать, какие вообще есть хорошие практики при обслуживании тяжеловесных моделей? Только GPU 24/7?

источник

12:28пожаловаться #3

SZ

Sasha Zhu in AWS_RU

Можно, конечно, кластер физический собрать, но вопрос увеличивающейся нагрузки

источник

12:28пожаловаться #4

AT

Al T in AWS_RU

лучше наверно gpu и использовать compute savings plans

источник

12:29пожаловаться #5

AT

Al T in AWS_RU

чтобы сэкономить, но зависит конечно от ваших задач.. elastic inference тоже популярная вещь

источник

12:30пожаловаться #6

SZ

Sasha Zhu in AWS_RU

Al T

чтобы сэкономить, но зависит конечно от ваших задач.. elastic inference тоже популярная вещь

Тогда в его сторону буду глядеть

источник

12:31пожаловаться #7

AT

Al T in AWS_RU

Можно, конечно, кластер физический собрать, но вопрос увеличивающейся нагрузки

ну а в чем проблема, autoscaling groups - держите в минимуме 1 инстанс

источник

12:31пожаловаться #8

SZ

Sasha Zhu in AWS_RU

То есть, я правильно понимаю, что придётся в любом случае держать 1 поднятый инстанс, да?

источник

12:33пожаловаться #9

AP

Alexander Patrushev in AWS_RU

Всем привет, у меня есть вопрос относительно sagemaker’a с лямбдами. Передо мной стоит задача обращения к модели, которая работает только на GPU (трансформер, работа с текстом), но постоянно держать поднятым инстанс очень не хочется. Есть ли у AWS какая-то опция для того, чтобы обрабатывать запросы только при обращении, в смысле, вести расчёты и тратить деньги?

Для GPU нет.
Можно попробовать сильно снизить стоимость 24*7 за счёт использования spot и elastic inference

источник

12:34пожаловаться #10

SZ

Sasha Zhu in AWS_RU

Alexander Patrushev

Для GPU нет.
Можно попробовать сильно снизить стоимость 24*7 за счёт использования spot и elastic inference

И вам спасибо! Про spot тоже впервые слышу

источник

12:34пожаловаться #11

AT

Al T in AWS_RU

если нужно GPU то мне кажется да, или один инстанс ec2 или 1 инстанс контейнера

источник

12:34пожаловаться #12

SZ

Sasha Zhu in AWS_RU

Al T

если нужно GPU то мне кажется да, или один инстанс ec2 или 1 инстанс контейнера

склоняюсь к ес2

источник

12:35пожаловаться #13

SZ

Sasha Zhu in AWS_RU

Ещё раз спасибо. Буду разбираться с документацией)

источник

12:35пожаловаться #14

AS

Alexey Stekov in AWS_RU

склоняюсь к ес2

spot сильно дешевле ec2 )

источник

12:38пожаловаться #15

AP

Alexander Patrushev in AWS_RU

Ещё раз спасибо. Буду разбираться с документацией)

Ещё как вариант посмотреть в сторону sagemaker, он сам возьмёт на себя автоматизацию deploy + monitoring. За счёт elastic inference можно цену снизить (в сравнении с чистым gpu)

источник

12:38пожаловаться #16

AS

Alexey Stekov in AWS_RU

источник

12:40пожаловаться #17

SZ

Sasha Zhu in AWS_RU

Alexander Patrushev

Ещё как вариант посмотреть в сторону sagemaker, он сам возьмёт на себя автоматизацию deploy + monitoring. За счёт elastic inference можно цену снизить (в сравнении с чистым gpu)

Вот изначально в сторону SageMaker'a и смотрела, на самом деле, но в первую очередь стоял вопрос снижения цены. Встречались примеры архитектур, в которых были использованы лямбды как триггеры для обработки запросов

источник

12:42пожаловаться #18

ST

Sergey Trapeznikov in AWS_RU

откуда читать

источник

12:42пожаловаться #19

AS

Alexey Stekov in AWS_RU

сверху вниз)

источник

12:43пожаловаться #20