Пополню ими список того, что "убьёт" моя технология. Всё что существует - avro, parquet, protobuf, flat buffers, json, xml и т.п. вместе взятое покрывает от силы 10% того функционала, который будет в моём формате-языке. У меня будут:
1) Поля произвольной битности. Например, можно хранить монохромные картинки без оверхеда и кастомной логики на стороне приложения
2) вычисляемые поля - был сначала формат с полями A и B, в новой версии поле A убрали, ввели C и указали, что A = C*2. Старая версия программы сможет прочитать новый файл. Новая версия сможет прочитать старый файл. Совместимость в обе стороны. Или, к примеру, можно не хранить пиксели изображения совсем, а записать формулу вычисления каждого пикселя картинки. Программа сможет прочитать этот файл как картинку, не имея представления о том, хранится ли она в файле или считается по формуле.
3) формат можно использовать как язык для обработки данных - писать всякие map, reduce, filter, считать статистические функции над данными и делать другую обработку.
Вот такая идея. Большую часть уже продумал и выглядит, что это вполне реально сделать силами одного человека и умениями, которые у меня уже есть. Жду не дождусь, когда руки дойдут до реализации.
Убийца ты конечно знатный, но ты же понимаешь что json, XML, protobuf все специализированные форматы для конкретной задачи. Твоя задача не сформулирована, абстрактна, а если уж говорить о реальности - мало производительна человеком у которого есть 'умения'