Size: a a a

2020 January 21

E

Eugene in Scrapy
Интерфейс простой. Как конструктор
источник

i

ildar in Scrapy
а есть api к питону?
источник

ЕJ

Евгений Jen in Scrapy
Eugene
Он самый
спасибо : )
источник

i

ildar in Scrapy
хотя дальше уже проще будет наверно на самом селениуме или pyppyteer'e наваять если сложней вещи нужны)
источник

E

Eugene in Scrapy
К сожалению, с питоном пока не дружит. Была идея, но пока не реализована
источник

i

ildar in Scrapy
а почему там в репе 3-4 года давность? или он переехал куда-то?
источник

E

Eugene in Scrapy
На сайте свежая версия
источник

i

ildar in Scrapy
или просто с какого-то этапа решили не обновлять опенсурсную часть?
источник

E

Eugene in Scrapy
Я даже не знал что у них на GitHub выложено
источник

B

Bulatbulat48 in Scrapy
источник

ЕJ

Евгений Jen in Scrapy
+
источник

A

Andrii in Scrapy
Нужно запарсить пдф (формат как на скрине). Таких статей 68 страниц.  нужно зпарсить заголовок, номер, автора, текст и т.д. в ексель.целый день ломаю голову как это сделать.  помогите советом или ткните в правильном направлении...
источник

A

Andrii in Scrapy
источник

A

Andrii in Scrapy
Всем привет
источник

МС

Михаил Синегубов in Scrapy
1. сам pdf смог конвертнуть в текст?
2. насколько я вижу, перед статьей идет:
[пустая строка]
PXXX

где XXX это число
источник

A

Andrii in Scrapy
Михаил Синегубов
1. сам pdf смог конвертнуть в текст?
2. насколько я вижу, перед статьей идет:
[пустая строка]
PXXX

где XXX это число
В текст могу, р001 ето # статьи
источник

МС

Михаил Синегубов in Scrapy
и это, это вопрос общий по питону, даже больше алгоритмов.
А тут, как бы, группа конкретно по фрейморку и парсингу сайтов

так в чем проблема? Смотри сам полученный текст и ищи особенности, как выловить то или иное.
А вообще. принципиально именно питоном это сделать? ИМХО проще руками перелопатить :)
источник

A

Andrii in Scrapy
Проблема сделать автоматизацию, таких томов ого-го) Ок. Понял-принял за фреймворк)
источник

МС

Михаил Синегубов in Scrapy
Andrii
Проблема сделать автоматизацию, таких томов ого-го) Ок. Понял-принял за фреймворк)
https://t.me/ru_python_beginners
https://t.me/ru_python

общие конфы по питону
источник

АП

Агент Печенька in Scrapy
Так он от нас.
источник