Телеграмм чат группы natural_language

Привет всем! меня зовут Кирилл и мы пилим проект по мониторингу данных о лекарствах, очень нужен NLP разработчик, который помог бы нам не потонуть в постах соцсетей по заданным тематикам

источник

20:20пожаловаться #5

Kirill Milchakov in Natural Language Processing

Если есть желание пообщаться о функционале дайте, знать, пожалуйста. Самому мне питон не потянуть))

источник

20:23пожаловаться #6

Andrey Tatarinov in Natural Language Processing

Oleg Serikov

чот неберёт(

да, был неправ

"на следующей неделе" парсит, а "следующий понедельник" - нет

источник

20:36пожаловаться #7

Kir L in Natural Language Processing

да нет идеального парсера дат, надо свой дописывать, мы так и делали, на ярги

источник

20:37пожаловаться #8

Andrey Tatarinov in Natural Language Processing

так может уже скинуться всем миром и заопенсурсить? )

источник

20:38пожаловаться #9

2020 December 22

Taras Novokhatsko in Natural Language Processing

источник

17:00пожаловаться #10

Taras Novokhatsko in Natural Language Processing

Всем привет. Только ступил на путь nlp. Есть вопросик: как найти заголовок в цифровом PDF, не используя CV и DL? Испробовал pyPDF2, PyMuPDF, pdfminer, pdfrw. Пока только получается выводить целый текст без артефактов, выделять страницы и сохранять их в новом файле.
Подскажите, в какую сторону смотреть по этому вопросу? Спасибо.

источник

17:06пожаловаться #11

Alex Surname in Natural Language Processing

привет. а что такое заголовок в пдф?

источник

17:07пожаловаться #12

Taras Novokhatsko in Natural Language Processing

Заголовок документа, сохраненного в pdf

источник

17:16пожаловаться #13

Alex Surname in Natural Language Processing

в терминах спецификации ПДФ заголовок это что?