Size: a a a

2020 July 02

OS

Oleg Shleiko in Scrapy
Спасибо большое
источник

🎱

🎱 in Scrapy
@Mifody @wrar42  спасибо парни, помогли :)
источник

К

Кирилл in Scrapy
Я тоже помогал
источник

К

Кирилл in Scrapy
Просто все быстрее написали
источник

🎱

🎱 in Scrapy
Кирилл
Просто все быстрее написали
и тебе спасибо😂

а есть еще альтернативный подход ?
источник

🎱

🎱 in Scrapy
handle_httpstatus_list = [404] ну пробую так обработать
источник

К

Кирилл in Scrapy
🎱
и тебе спасибо😂

а есть еще альтернативный подход ?
нет, всё верно сказали
источник
2020 July 03

SS

Stepan Smirnov in Scrapy
Вопром не совсем по теме, но: как извлекать информацию из pdf файлов, которые имеют практически одинаковый вид? Самих файлов около 10k.
источник

S

SoHard 🎄 in Scrapy
Stepan Smirnov
Вопром не совсем по теме, но: как извлекать информацию из pdf файлов, которые имеют практически одинаковый вид? Самих файлов около 10k.
найти либу которая читает pdf
источник

S

SoHard 🎄 in Scrapy
извлечь информацию
источник

S

SoHard 🎄 in Scrapy
...
источник

S

SoHard 🎄 in Scrapy
PROFIT
источник

🇺L

🇺🇦 Ad Libitum in Scrapy
Такое ощущение, что ЖЖ отдаёт страницы Java-скриптом. Например я заголовок могу получить а внутренности не оч.
источник

🇺L

🇺🇦 Ad Libitum in Scrapy
Может быть надо заголовок прописать браузера какого-то?
источник

🇺L

🇺🇦 Ad Libitum in Scrapy
Или как поступить?
источник

S

SoHard 🎄 in Scrapy
🇺🇦 Ad Libitum
Такое ощущение, что ЖЖ отдаёт страницы Java-скриптом. Например я заголовок могу получить а внутренности не оч.
отключить js в браузере и посмотреть
источник

К

Кирилл in Scrapy
Изучи вопрос, узнай точно отдает ли Java-скриптом
источник

🇺L

🇺🇦 Ad Libitum in Scrapy
Напомните, пожалуйста, как из консоли в хроме быстро отключить JS чтобы не стаивть лишних плагинов
источник

SS

Stepan Smirnov in Scrapy
🇺🇦 Ad Libitum
Напомните, пожалуйста, как из консоли в хроме быстро отключить JS чтобы не стаивть лишних плагинов
ctrl+p
>Ja
из предложенных вариантов выбираете disable JS
источник

🇺L

🇺🇦 Ad Libitum in Scrapy
Спс
источник