Телеграмм чат группы ctodailychat страница 8708

01:33пожаловаться #1

AWS Lambda triggered twice for a sigle SQS Message

И ещё
https://stackoverflow.com/questions/64428146/aws-lambda-triggered-twice-for-a-sigle-sqs-message

Stack Overflow

I have a system where a Lambda is triggered with event source as an SQS Queue.Each message gets our own internal unique id to differentiate between two requests .
Now lambda deletes the message fro...

01:36пожаловаться #2

ну походу да, надо писать внешний трекер в какойто базе https://stackoverflow.com/questions/62364409/sqs-fifo-queues-not-ensuring-single-time-delivery-when-used-as-lambda-trigger

либо душить concurrency

либо увеличивать visibility timeout

01:41пожаловаться #3

Я посчитал, что возможна двойная доставка одного и того же события с набором сообщений. Поскольку это FIFO, то каждое сообщение имеет group id, и в одном событии может быть набор сообщений с разными group id. Стало быть, можно собрать уникальные group id, отсортировать и составить в ключ, по которому и делается блокировка. Свойства FIFO гарантируют, что group id не будет обработан параллельно

01:41пожаловаться #4

Ответил, но вопрос про исключение открытый.

01:41пожаловаться #5

Visibility timeout у меня 18 минут, таймаут лямбды 15

01:45пожаловаться #6

если у тебя самописный сторонний лок - то я считаю что во "втором треде" надо бросать эксепшен, а в "первом треде" после релиза лока делать руками "delete" из sqs

01:46пожаловаться #7

Да, руками я удаляю

01:46пожаловаться #8

а через что сделан лок, кстати?

01:47пожаловаться #9

Alexander Panko in ctodailychat

может проще не блокировку а просто хранитьпослежнее обработаное событие, у него же наверняка есть чтонить уникальное аля timestamp с точностью хорошей? тогда просто выбрасывать из пачки все уже обработанные и более железобетонно даже если размер пачки поменяется каким то образом, дедупликация сработает как надо

01:47пожаловаться #10

https://aws.amazon.com/ru/blogs/database/building-distributed-locks-with-the-dynamodb-lock-client/

Amazon Web Services

Building Distributed Locks with the DynamoDB Lock Client | Amazon Web Services

Alexander Patrikalakis and Sasha Slutsker are senior software development engineers with Amazon. TL;DR At Amazon, teams all across the company build upon AWS services just like AWS’s external customers. Here we have a contribution from Alex and Sasha, who work on teams supporting Amazon.com about a new client library that they developed to make their […]

01:48пожаловаться #11

так там батчи параллельно могут запуститься, первый закончит позже второго

01:48пожаловаться #12

Часть из пачки внутри одного group id может быть обработана и удалена, а часть - нет. То есть, таймштамп последнего обработанного тут неприменим, тут не массив с конца откусывают, а дырки в нём делают.

01:50пожаловаться #13

Anton Revyako in ctodailychat

я походу стар для этого дерьма, я больше работать люблю )

01:53пожаловаться #14

Я вокруг этих распределённых вещей уже месяца два хожу (именно с FIFO, так-то дольше), и самое неприятное, что непонятно, как это надёжно делать и проверять.

Добрался до https://verdi.uwplse.org, но что-то я сомневаюсь, что оно массово применяется. Понятно, что в самом Амазоне до использования TLA+ дошли, но где Амазон, и где остальные.

01:55пожаловаться #15

если ктото юзает SQL Server - смотрите какой прикольный хак
https://news.ycombinator.com/item?id=27153232

Understanding SQS retries - AWS Lambda

02:02пожаловаться #16

Igor V in ctodailychat

> Если из обработчика в лямбде (в С#) выбросить исключение, то это будет воспринято (кем?), как просьба ещё раз отправить эти же сообщения, эту пачку, за исключением тех, что были явно удалены в ходе выполнения кода лямбды. Если же исключения не было, то сообщения будут удалены (кем?)

Все зависит от retry policy (aka visibility timeout в мире sqs) + redrive policy (aka конфигурации dead-letter queue). Но это все детали реализации SQS о которых консьюмер вообще ничего не должен знать. Так же как консьюмер не должен ничего знать о существовании других консьюмеров.

Задача консьюмера принять сообщение, сделать dedup и выполнить работу. Если вдруг нужны distributed locks (а если у вас очереди, то они не нужны т.к. есть более подходящие инструменты), то лучше попытаться поставить лок и в случае, если лок уже стоит, вместо exception имеет смысл вернуть сообщение руками в конец очереди:
if !aquitedLock { enqueueMessage(); return } if dedup ( return }

Или использовать FIFO queues (и там миллион своих приколов)

> Я не могу найти ответа в документации AWS.
https://docs.aws.amazon.com/lambda/latest/operatorguide/sqs-retries.html

Amazon

The specific retry behavior for processing SQS messages is determined in the SQS queue configuration. Here you can set the visibility timeout , message retention period, and delivery delay.

04:06пожаловаться #17

Igor V in ctodailychat

sqs очереди имеют семантику at-least-once delivery

Amazon SQS stores copies of your messages on multiple servers for redundancy and high availability. On rare occasions, one of the servers that stores a copy of a message might be unavailable when you receive or delete a message.

If this occurs, the copy of the message isn't deleted on that unavailable server, and you might get that message copy again when you receive messages. Design your applications to be idempotent (they should not be affected adversely when processing the same message more than once).

04:10пожаловаться #18

Alexander Panko in ctodailychat

тогда может стоит подумать как сделать собственно обработку идемпотентной если это возможно и сэкономить на этой сложности с блокировками и зависимости от семантики очереди

04:51пожаловаться #19

Andrey in ctodailychat

Поймать исключение в лямбде и перекинуть сообщение в dead letter queue