Size: a a a

Сбор и аналитика системных сообщений

2021 February 03

В

Вадим in Сбор и аналитика системных сообщений
Aleksey Shirokikh
есть что почитать на эту тему ?
time series db наверное поможет понять что как и почему
но имея опыт БД разработки выскажу свое мнение - все должно быть в меру и иметь смысл
в локи например нет смысла плодить метки вообще - зная время инцидента и автоматически добавленные метки - легко при помощи regexp либо распасенного json найти все что нужно
источник

AS

Aleksey Shirokikh in Сбор и аналитика системных сообщений
Вадим
time series db наверное поможет понять что как и почему
но имея опыт БД разработки выскажу свое мнение - все должно быть в меру и иметь смысл
в локи например нет смысла плодить метки вообще - зная время инцидента и автоматически добавленные метки - легко при помощи regexp либо распасенного json найти все что нужно
это всё понятно. почему в проме важны метки и их кардинальность — мне ясно.
не ясно почему большое колво меток плохо для локи.
ведь они позиционируются как раз типа как пром но для логов.
источник

AS

Aleksey Shirokikh in Сбор и аналитика системных сообщений
вот например в гугле меток на каждом логе очень много. и это довольно удобно. можно фильтрануть по кластеру, ворклоаду, региону и команде разработки и прочему.
такое же поведение я перенес на спланк. это тоже довольно удобно. но почему не на локи ?
источник

i

inqfen in Сбор и аналитика системных сообщений
что-то по этой теме тоже читал, там поиск реализован не так же как в проме
источник

i

inqfen in Сбор и аналитика системных сообщений
То есть ты можешь вешать хоть по 100 лейблов, но это поиск нагрузит
источник

i

inqfen in Сбор и аналитика системных сообщений
И поэтому чем их меньше - тем для него лучше
источник

AS

Aleksey Shirokikh in Сбор и аналитика системных сообщений
ну вот я про то где почитать этот момент. особенности реализации стораджа
источник

В

Вадим in Сбор и аналитика системных сообщений
Aleksey Shirokikh
это всё понятно. почему в проме важны метки и их кардинальность — мне ясно.
не ясно почему большое колво меток плохо для локи.
ведь они позиционируются как раз типа как пром но для логов.
смысл в том чтобы индекс был маленьким - этим достигается скорость выборки нужного блока логов из террабайтов а уж грепать этот выбранный кусочек - это пустяки
источник

AS

Aleksey Shirokikh in Сбор и аналитика системных сообщений
полагаться на чьёто мнение в этом месте не хотелось бы.
источник

AS

Aleksey Shirokikh in Сбор и аналитика системных сообщений
Вадим
смысл в том чтобы индекс был маленьким - этим достигается скорость выборки нужного блока логов из террабайтов а уж грепать этот выбранный кусочек - это пустяки
маленьковость индекса это относительное понятие
источник

В

Вадим in Сбор и аналитика системных сообщений
Aleksey Shirokikh
маленьковость индекса это относительное понятие
почитайте введение - они там об этом пишут в абсолютных величинах)
источник

В

Вадим in Сбор и аналитика системных сообщений
все предыдущие системы сбора логов основаны на идеях реляционных баз и для скорости выборок требуют большого количества индексов == железа === денег
источник

AS

Aleksey Shirokikh in Сбор и аналитика системных сообщений
предыдущие системы сбора логов не основаны на реляционных моделях.
источник

AS

Aleksey Shirokikh in Сбор и аналитика системных сообщений
по крайней мере я не знаю кто бы хотел вставлять в условную муську логи.
источник

AS

Aleksey Shirokikh in Сбор и аналитика системных сообщений
их пихали в эластик или монгу а они ну совсем не реляционные.
источник

В

Вадим in Сбор и аналитика системных сообщений
Aleksey Shirokikh
предыдущие системы сбора логов не основаны на реляционных моделях.
идеи !== реализации
источник

AS

Aleksey Shirokikh in Сбор и аналитика системных сообщений
как я вижу для хранения индекса в локи используется
An index for the chunks. This index can be backed by:

   Amazon DynamoDB
   Google Bigtable
   Apache Cassandra
источник

В

Вадим in Сбор и аналитика системных сообщений
Aleksey Shirokikh
их пихали в эластик или монгу а они ну совсем не реляционные.
и в монге и в других БД - основное понятие реляции - связи присутствует между сущностями
источник

AS

Aleksey Shirokikh in Сбор и аналитика системных сообщений
ни один из них не реляционный. и не имеет изместныхмне ограничений на выборки по набору полей
источник

AS

Aleksey Shirokikh in Сбор и аналитика системных сообщений
Вадим
и в монге и в других БД - основное понятие реляции - связи присутствует между сущностями
в монге нет реляций
источник