Size: a a a

Natural Language Processing

2020 December 21

OS

Oleg Serikov in Natural Language Processing
Andrey Tatarinov
Dateparser наши задачи решил
понятно! а вы не решали что-то типа "через неделю в обед" дейтпарсером? у меня что-то не берёт
источник

AT

Andrey Tatarinov in Natural Language Processing
Oleg Serikov
понятно! а вы не решали что-то типа "через неделю в обед" дейтпарсером? у меня что-то не берёт
Лол, к счастью у нас более формализованный контекст. «В обед» он не распарсит
источник

AT

Andrey Tatarinov in Natural Language Processing
«Следующий понедельник» распарсит
источник

OS

Oleg Serikov in Natural Language Processing
чот неберёт(
источник

KM

Kirill Milchakov in Natural Language Processing
Привет всем! меня зовут Кирилл и мы пилим проект по мониторингу данных о лекарствах, очень нужен NLP разработчик, который помог бы нам не потонуть в постах соцсетей по заданным тематикам
источник

KM

Kirill Milchakov in Natural Language Processing
Если есть желание пообщаться о функционале дайте, знать, пожалуйста. Самому мне питон не потянуть))
источник

AT

Andrey Tatarinov in Natural Language Processing
Oleg Serikov
чот неберёт(
да, был неправ

"на следующей неделе" парсит, а "следующий понедельник" - нет
источник

KL

Kir L in Natural Language Processing
да нет идеального парсера дат, надо свой дописывать, мы так и делали, на ярги
источник

AT

Andrey Tatarinov in Natural Language Processing
так может уже скинуться всем миром и заопенсурсить? )
источник
2020 December 22

TN

Taras Novokhatsko in Natural Language Processing
.
источник

TN

Taras Novokhatsko in Natural Language Processing
Всем привет. Только ступил на путь nlp. Есть вопросик: как найти заголовок в цифровом PDF, не используя CV и DL? Испробовал  pyPDF2, PyMuPDF, pdfminer, pdfrw. Пока только получается выводить целый текст без артефактов, выделять страницы и сохранять их в новом файле.
Подскажите, в какую сторону смотреть по этому вопросу? Спасибо.
источник

AS

Alex Surname in Natural Language Processing
привет. а что такое заголовок в пдф?
источник

TN

Taras Novokhatsko in Natural Language Processing
Заголовок документа, сохраненного в pdf
источник

AS

Alex Surname in Natural Language Processing
в терминах спецификации ПДФ заголовок это что?
источник

AS

Alex Surname in Natural Language Processing
в штмл есть <title> например
источник

TN

Taras Novokhatsko in Natural Language Processing
Думаю, что title
источник

AS

Alex Surname in Natural Language Processing
я написал свой парсер для пдф, и каких-то сущностей вроде заголовка документа я там не припоминаю
источник

AS

Alex Surname in Natural Language Processing
нет там такого
источник

TN

Taras Novokhatsko in Natural Language Processing
А он есть и задача такая поставлена. Не ясен твой ответ...
источник

AS

Alex Surname in Natural Language Processing
источник