Телеграмм чат группы ctodailychat страница 6126

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

ctodailychat

1379 membersпожаловаться на группу

2020 September 02

AP

Alexander Panko in ctodailychat

Сергей Аксёнов

Там было написано: 10к RPS на запись, 3к - на чтение.

ну для примера appodeal у меня держал 300к rps суммарно на ~150 серверах, при том что основная часть была на... рельсах) вобщем из спортивного интереса покурю на досуге

источник

01:39пожаловаться #1

СА

Сергей Аксёнов... in ctodailychat

Alexander Panko

ну для примера appodeal у меня держал 300к rps суммарно на ~150 серверах, при том что основная часть была на... рельсах) вобщем из спортивного интереса покурю на досуге

В этом сервисе основная сложность - это общая глубина хранения в 30 дней, что выливается в эпические сотни миллиардов записей и необходимость их тримать аккуратно (спойлер: триммингом занимается TTL-индекс).

источник

01:41пожаловаться #2

AP

Alexander Panko in ctodailychat

Сергей Аксёнов

В этом сервисе основная сложность - это общая глубина хранения в 30 дней, что выливается в эпические сотни миллиардов записей и необходимость их тримать аккуратно (спойлер: триммингом занимается TTL-индекс).

да это усложняет, но есть сильное ощущение что задачу можно решить элегантнее что даст сильную экономию в ресурсах, я в первую очередь это имею ввиду а не оптимизацию кода/хранилища, хотя с хранилищем такое же ощущение, что mongo тут overkill и на ней сэкономить можно очень существенно

источник

01:45пожаловаться #3

СА

Сергей Аксёнов... in ctodailychat

Сергей Аксёнов

Облака к нам в очередь выстраиваются) Нет, контент в рамках. Edgy, но не более того. Модераторов жалко, конечно, но, говорят, что в Фейсбуке ещё хлеще.

https://ifunny.co/ - если поскроллить вниз, это наш featured feed (он же рек, выражаясь языком тиктокеров), нефильтрованный, как Францисканер на кране) Это вот самый типичный наш контент.

You can’t buy fun but you can download it

IFunny is fun of your life. Images, GIFs and videos featured seven times a day. Your anaconda definitely wants some. Fun fact: we deliver faster than Amazon.

источник

01:45пожаловаться #4

СА

Сергей Аксёнов... in ctodailychat

Alexander Panko

да это усложняет, но есть сильное ощущение что задачу можно решить элегантнее что даст сильную экономию в ресурсах, я в первую очередь это имею ввиду а не оптимизацию кода/хранилища, хотя с хранилищем такое же ощущение, что mongo тут overkill и на ней сэкономить можно очень существенно

Очень интересно послушать, какие идеи появятся) Готов отвечать на вопросы, может даже лучше прямо здесь, мне кажется, многим будет интересно.

источник

01:46пожаловаться #5

СА

Сергей Аксёнов... in ctodailychat

Alexander Panko

да это усложняет, но есть сильное ощущение что задачу можно решить элегантнее что даст сильную экономию в ресурсах, я в первую очередь это имею ввиду а не оптимизацию кода/хранилища, хотя с хранилищем такое же ощущение, что mongo тут overkill и на ней сэкономить можно очень существенно

Вообще решение действительно очень прямолинейное, но у него есть простое обоснование: сервис очень важен для продукта, при его отказах раз в 3-4 месяца метрики сразу втыкаются в землю: люди открывают приложение, видят то же самое, что уже видели, и тут же закрывают.

Мы думали вообще хранить отметки о прочтении на клиенте, но опять же, у настойчивого юзера их может скапливаться тысяч 10 в месяц, непонятно как делать запрос на новый контент в таком раскладе.

источник

01:53пожаловаться #6

AP

Alexander Panko in ctodailychat

Сергей Аксёнов

Вообще решение действительно очень прямолинейное, но у него есть простое обоснование: сервис очень важен для продукта, при его отказах раз в 3-4 месяца метрики сразу втыкаются в землю: люди открывают приложение, видят то же самое, что уже видели, и тут же закрывают.

Мы думали вообще хранить отметки о прочтении на клиенте, но опять же, у настойчивого юзера их может скапливаться тысяч 10 в месяц, непонятно как делать запрос на новый контент в таком раскладе.

а, ну это важно кстати, запросы на чтение истории они важны не для юзеров а для сервиса готовящего ленту контента для юзера, так?

источник

01:54пожаловаться #7

СА

Сергей Аксёнов... in ctodailychat

Alexander Panko

а, ну это важно кстати, запросы на чтение истории они важны не для юзеров а для сервиса готовящего ленту контента для юзера, так?

Конечно. Клиент просто говорит: дай следующую пачку контента, limit 30. Рекоммендер умеет отдавать условно топ-1000 контента из пула, фильтровать не умеет, поэтому фильтрация идёт через сервис прочитанных.

источник

01:58пожаловаться #8

AP

Alexander Panko in ctodailychat

Сергей Аксёнов

Конечно. Клиент просто говорит: дай следующую пачку контента, limit 30. Рекоммендер умеет отдавать условно топ-1000 контента из пула, фильтровать не умеет, поэтому фильтрация идёт через сервис прочитанных.

А напомни плиз про период в 30 дней, откуда ноги растут? Неужели за 30 дней в пуле контента не набирается достаточно чтобы старый контент на глаза снова не попался?

источник

02:00пожаловаться #9

СА

Сергей Аксёнов... in ctodailychat

Alexander Panko

А напомни плиз про период в 30 дней, откуда ноги растут? Неужели за 30 дней в пуле контента не набирается достаточно чтобы старый контент на глаза снова не попался?

Экспериментально подобран. Рекоммендер очень хорош (см. статью, кидал ссылку выше) , и реально выдаёт один и тот же контент в топе одному юзеру. Надо посмотреть, кстати, динамику изменения топа, но кажется, что полная смена контента в топ-200 будет происходить примерно раз в 2 недели. А просмотреть 200 можно за один заход.

источник

02:04пожаловаться #10

AP

Alexander Panko in ctodailychat

Сергей Аксёнов

Экспериментально подобран. Рекоммендер очень хорош (см. статью, кидал ссылку выше) , и реально выдаёт один и тот же контент в топе одному юзеру. Надо посмотреть, кстати, динамику изменения топа, но кажется, что полная смена контента в топ-200 будет происходить примерно раз в 2 недели. А просмотреть 200 можно за один заход.

а можешь плиз пальцем ткнуть в ссылку? кажется листать уже очень далеко

источник

02:06пожаловаться #11

СА

Сергей Аксёнов... in ctodailychat

https://habr.com/ru/company/funcorp/blog/517182/

Как мы научили робота чувству юмора

В IT-кругах ходит такая шутка, что машинное обучение (machine learning, ML) — это как секс в среде подростков: все об этом говорят, все делают вид, что этим за...

источник

02:07пожаловаться #12

СА

Сергей Аксёнов... in ctodailychat

Вот там настоящий rocket science: 12 GPU-серверов, модель переобучается каждые 10 минут)

источник

02:10пожаловаться #13

AM

Aga Mahmudov in ctodailychat

Сергей Аксёнов

Вот там настоящий rocket science: 12 GPU-серверов, модель переобучается каждые 10 минут)

На какой отметке роста вы начали заморачиваться с этим всем?

источник

02:42пожаловаться #14

СА

Сергей Аксёнов... in ctodailychat

На какой отметке роста вы начали заморачиваться с этим всем?

Не понял вопрос. На какой цифре DAU?

источник

02:44пожаловаться #15

AM

Aga Mahmudov in ctodailychat

Сергей Аксёнов

Не понял вопрос. На какой цифре DAU?

Думаю да, когда вы начали прямо всерьез делить на микросервисы?

источник

02:44пожаловаться #16

СА

Сергей Аксёнов... in ctodailychat

Думаю да, когда вы начали прямо всерьез делить на микросервисы?

Мы не взялись. Почти вся бизнес-логика лежит внутри монолита на 0.5м строк. В сервисы вынесены инфраструктурного типа вещи, рассылка пуш-уведомлений например. Или сбор и агрегация аналитики с клиентов.

источник

02:49пожаловаться #17

AP

Alexander Panko in ctodailychat

Сергей Аксёнов

Ну окей, вот, например, боевая задачка: сервис "отметки о прочитанном".

Сервис хранит 30 дней истории просмотров юзерами контента строками вида:

user_id int96, content_id string(10), timestamp int32

На базу идёт нагрузка в 10000 RPS на запись блоками от 1 до 10 строк. Итого в таблице постоянно хранится примерно полтора триллиона строк. Понятно, что таблицу надо обрезать не реже чем раз в сутки, при этом не блокируя остальных операций.

Также идёт нагрузка в 3000 RPS запросов вида: "вот список content_id размером не более 1000 элементов, верни мне те из них, которые не были просмотрены юзером user_id", т.е. которых нет в таблице.

Ну и всякая мелочь типа "дай мне историю просмотренного контента для юзера", суммарно скажем ещё на 2000 RPS, для ровного счёта.

Сколько реплик и шардов Постгри нужно для реализации такого сервиса, и с какого раза удастся так его написать, чтобы он отвечал не более чем за 50ms и имел среднее время между инцидентами не менее 3 недель, а время восстановления не более часа? Вопрос со звёздочкой: как будем делать и хранить бэкапы?

вот этот content_id он никак не упорядочен? возможно ли как то дополнительно к нему timestamp создания цеплять?

источник

03:59пожаловаться #18

AP

Alexander Panko in ctodailychat

Сергей Аксёнов

https://habr.com/ru/company/funcorp/blog/517182/

Как мы научили робота чувству юмора

В IT-кругах ходит такая шутка, что машинное обучение (machine learning, ML) — это как секс в среде подростков: все об этом говорят, все делают вид, что этим за...

ой а сервис то на питончике, есть где разгуляться, ксати еще вопрос формат запросов json?

источник

04:03пожаловаться #19

K

KivApple in ctodailychat

я работал с одним синьором, который считал, что отсутствующее поле в json и присутствующее поле со значением null равнозначны...

Ну с некоторыми либами так оно и есть

источник

07:01пожаловаться #20