Первая версия предназначена только для бинарного. Чтобы разбирать все, наверное придётся встроить прямо в рантайм генератор парсеров на основе грамматики. А генератор парсеров написать будет сложнее, чем сделать простой парсер для языка.
Я уже писал обобщённый десериализатор для JSON-подобных языков, там можно настроить наличие/отсутствие кавычек, разделитель (':', '=' или любой другой) и ещё кучу всего, что позволило парсить как JSON, так и подмножество XML, а также сишные структуры с designated initializers. Написал за пару дней примерно вместе с сериализатором.
А язык я проектировал так, что его парсер будет не сильно сложнее парсера, который в десериализаторе. Думаю, он займёт не больше недели (2 выходных + вечера).
Есть гораздо более сложные задачи, чем парсер, но большинство из них нужно будет решить уже после того, как выйдет первая версия. И так как язык не будет языком общего назначения, по крайней мере в ближайшие пару лет, то решать их придётся на C++.
Текст - это подмножество двоичного формата, да да. Или Вы имеете ввиду, что система сможет успешно разбирать не совсем любой двоичный формат, а только некое подмножество? Что же это за серебряная пуля такая? Вы же собираете задачи для обобщения, чтобы учесть всё и не переделывать по мере выяснения подробностей. По-моему, текстовый формат - это отличный кандидат в такие задачи.