Всем привет. Только ступил на путь nlp. Есть вопросик: как найти заголовок в цифровом PDF, не используя CV и DL? Испробовал pyPDF2, PyMuPDF, pdfminer, pdfrw. Пока только получается выводить целый текст без артефактов, выделять страницы и сохранять их в новом файле.
Подскажите, в какую сторону смотреть по этому вопросу? Спасибо.