Size: a a a

2018 January 10

Dv

Dr. Friedrich von Never in pro.latex
Bohdan Horbeshko
Лучше из постскрипта в DOCX рендерить, спрос куда больше будет
А можно ли? Как выглядит постскрипт? В нём буквы читаемые вообще? А LaTeX можно в постскрипт?
источник

Dv

Dr. Friedrich von Never in pro.latex
Но вообще, это обломидзе всё равно.
источник

Dv

Dr. Friedrich von Never in pro.latex
Потому что формулы.
источник

Dv

Dr. Friedrich von Never in pro.latex
Формулы нужно из LaTeX в Word конвертировать. (Pandoc умеет, если что.)
источник

BH

Bohdan Horbeshko in pro.latex
Dr. Friedrich von Never
А можно ли? Как выглядит постскрипт? В нём буквы читаемые вообще? А LaTeX можно в постскрипт?
Буквы читаемые, если шрифты правильно замаплены, у него основная проблема в том, что семантики ни хрена нету, куски текста тупо абсолютно спозиционированы
источник

Dv

Dr. Friedrich von Never in pro.latex
Формулу ты в постскрипте уже нормально не прочитаешь.
источник

Dv

Dr. Friedrich von Never in pro.latex
Просто у меня идея-то какая: раз LaTeX умеет рендерить во все эти обскурные форматы типа XDV, то, наверное, у него какой-то код рендера в отдельном месте есть. И можно этот рендер сделать сменяемый, чтобы можно было рендерить в другие места вместо XDV. Я надеялся.
источник

BH

Bohdan Horbeshko in pro.latex
Dr. Friedrich von Never
Просто у меня идея-то какая: раз LaTeX умеет рендерить во все эти обскурные форматы типа XDV, то, наверное, у него какой-то код рендера в отдельном месте есть. И можно этот рендер сделать сменяемый, чтобы можно было рендерить в другие места вместо XDV. Я надеялся.
Ну вот зитек вроде напрямую с PDF работает
источник

Dv

Dr. Friedrich von Never in pro.latex
Bohdan Horbeshko
Ну вот зитек вроде напрямую с PDF работает
Нет, там как раз XDV.
источник

Dv

Dr. Friedrich von Never in pro.latex
XDV — это чуть модифицированный DVI.
источник

Dv

Dr. Friedrich von Never in pro.latex
И, насколько мне удалось понять, это уже слишком низкоуровневый формат для моей задачи (если мы хотим работать с формулами нормально).
источник

Dv

Dr. Friedrich von Never in pro.latex
Ну то есть с таким же успехом можно анализировать итоговую PDF'ку — в ней тоже весь текст есть, но связность блоков слабая, и формулы автоматически очень сложно собрать во что-то удобочитаемое.
источник

A

Alex Ф-ф-фэils!🌠︙ in pro.latex
надо рефактить этот говнокод
источник

Dv

Dr. Friedrich von Never in pro.latex
Alex Ф-ф-фэils!🌠︙
надо рефактить этот говнокод
Я начинаю с малого — надо стратегию выбрать.
источник

A

Alex Ф-ф-фэils!🌠︙ in pro.latex
меньше связности богу связности!
источник

Dv

Dr. Friedrich von Never in pro.latex
Конечно же, я не один такой умный (и далеко не самый умный). Люди уже давным-давно начали проекты по рефакторингу LaTeX, и тут скорее надо выбрать, к кому можно примкнуть :)
источник

Dv

Dr. Friedrich von Never in pro.latex
Вот проект, что недавно скинули — tectonic — он очень похож на то, что нам нужно. Автор работает в том числе над форматом XDV, чтобы его раскурить и в итоге сделать что-то типа абстрактного рендера, который можно было бы использовать для преобразования в другие форматы.
источник

BH

Bohdan Horbeshko in pro.latex
Я ваще думаю, что пора бы уже закопать извращённое наследие TeX и запилить заместо что-то хипсторское и шебное. Но у шеба есть важная проблема, которая ставит крест на его применимости для серьёзной типографики — точность межсловных/межбуквенных интервалов очень низкая. Сверстать пиксельпёрфектно макет с большой простынёй текста почти нереально, даже если шрифт и его рендеринг точно совпадают — мелкие неточности накапливаются и текст уползает. Из-за этого, в частности, pdf.js весьма извращённый и тормозной, он буквы чуть ли не по одной позиционирует
источник

Dv

Dr. Friedrich von Never in pro.latex
Bohdan Horbeshko
Я ваще думаю, что пора бы уже закопать извращённое наследие TeX и запилить заместо что-то хипсторское и шебное. Но у шеба есть важная проблема, которая ставит крест на его применимости для серьёзной типографики — точность межсловных/межбуквенных интервалов очень низкая. Сверстать пиксельпёрфектно макет с большой простынёй текста почти нереально, даже если шрифт и его рендеринг точно совпадают — мелкие неточности накапливаются и текст уползает. Из-за этого, в частности, pdf.js весьма извращённый и тормозной, он буквы чуть ли не по одной позиционирует
А меня вот межбуквенные интервалы не интересуют, у меня другая задача — я хочу из обычного LaTeX-документа получать абстрактное представление, и с ним потом работать.
источник

BH

Bohdan Horbeshko in pro.latex
Там то ли в десятые, то ли в сотые пиксела упирается, и пляшет от браузера к браузеру
источник