Всем привет!
Похоже сегодня день вопросов про DQ, задам и я свой)
Есть огромная таблица (события мобильной аналитики) и есть множество полей, по которым надо фильтровать/группировать данные.
Есть 2 варианта модели данных:
1. Звезда, в которой таблицы измерений обычно состоят из 2х-3х столбцов - ключ, индекс для сортировки и более приятное глазу название измерения.
Минус: использование полей из справочников увеличивает сложность запросов (джойны и все такое).
2. Одна таблица фактов, фильтрация/группировка происходит по полям из неё же, индексы также внутри таблицы фактов (генерятся на стороне источника и физически хранятся в витрине).
Плюсы: работает гораздо быстрее.
Минусы: морально тяжело отказаться от звезды 😄
Кто что скажет, ок ли второй вариант, какие тут вообще бест практики? Доки читал, оптимизации для dq делал, но рекомендаций по модели данных для DQ не видел)
Источник - колоночная БД, если что)
Как-то тут уже писали, что вообще, надо звезду, но если прям таблица одна, и там все есть, то вполне рабочий вариант табличка + календарь (отдельно). И я за него))) Конечно, еще вопрос, а насколько большая табличка и пр.