У меня предметная область такая , что появление новых колонок это норма, примерно раз в месяц будет появляться новые показатели. И пока моей фантазии хватило только на то , что бы найти способ хранить массив в ячейке. Конечно есть ещё путь , когда индикаторы переносятся в строчки и в звезде только одно поле для значений.
Но это не Hadoop way 😂 теряется все преимущество поколоночного хранения индикаторов.
В общем вопрос такой , как лучше обновлять старые паркетники на предмет изменения состава колонок.
Есть ли стандартный способ хранения и соответствующие библиотеки , для обработки метаданных в таком изменчивом мире ?)