
4 Хранение
4.1 elastic
Фаундер, технарь на должности CTO: А у индексов эластика пробовали кодек поменять (index.codec параметр)? По умолчанию он и не стоит на максимальном сжатии, а на максимальной производительности алгоритмом LZ4. При нормально написанном маппинге и выставленном максимальном сжатии в deflate не должно сильно отличаться, lucene не такой уж и большой индекс.
Скб-контур собирает с 50+ сервисов логи, у них там почти два петабайта уже: https://www.youtube.com/watch?v=KH4Ia0uir8Y если интересно
Вот, почитайте. Тут все рекомендации собраны: https://www.elastic.co/guide/en/elasticsearch/reference/7.3/tune-for-disk-usage.html
Там и про снижение объёма хранимых данных тоже написано, каждый индекс настраиваться под нужные данные, что будет храниться, а что нет. А чуть ниже есть и про сжатие.
Топик-стартер: У меня к эластику вопросов вообще нет, в плане поиска по тексту, особенно не четкому он помоему уделывает всех. Но накладные расходы на хранение это жесть :)
И да под не текстовую аналитику, я бы что то другое выбрал :)
Решатель SRE/ChatOPS/DevOps задачек в мониторинге: На прошлом HighLoad++ VK рассказывали, как решали похожую проблему. Они выбрали Clickhouse + самописный сервис для записи, который они выложили в опенсорс https://m.habr.com/ru/company/vk/blog/430168/
Специалист по запуску сложных финтех стартапов
А вообще логи в CH можно и более чем в 10 раз жать. Ну и возможность все старше нескольких дней убирать в архив тут крайне ценная.
5 Железо
Тимлид большой соцсети: 2 петабайта! Это сколько на дата ноду?
Технический директор фото-сервиса: без сжатия это считай полнстью забитая оборудованием стойка и стоит такое удовольствие 200-300к usd.
Владелец и технический руководитель своего проекта: Это ты на ssd посчитал? Есть пограничные конфигурации, где 2 петабайта можно впихнуть в 8u.
Технический директор фото-сервиса: я пихал, но начитнается беда с сетевым вводом и поиском.
Владелец и технический руководитель своего проекта: Ага. Я говорю про огромные ящики, в которых один дохлый ксеончик обслуживает 96 хардов. Те это только очень холодный архив.
Технический директор фото-сервиса: и фиг туда что загрузишь! и фиг туда что загрузишь!
Владелец и технический руководитель своего проекта: Внезапно, надо проконсультироваться у инженера здания
Технический директор фото-сервиса: а под нагрузкой - под 20KW жрет стойка, при охлаждением этого воздухом в коридорах становится ВЕТРЕННО
6 Просмотр
6.1 lighthouse
Специалист по запуску сложных финтех стартапов
И чем логи смотреть планируете? Нам пока больше всего понравился lighthouse (или запросами промо из DataGrip/IDEA)