не бинарь никак, я брал plain text, метки иерархии разделов и строил объектную модель, типа "раздел - статья - пункт - подпункт", с выделением заголовков. Потом это выгонял в хтмл со стилями. Если есть текст с боль-мень регулярной структурой, маркдаун тоже не проблема загнать