Size: a a a

2020 August 22

AR

Andrey Rahmatullin in Scrapy
Тут такие регулярно
источник

S

SoHard 🎄 in Scrapy
не
источник

S

SoHard 🎄 in Scrapy
это он в чат скрапи с кодом из бс4 пришёл
источник

S

SoHard 🎄 in Scrapy
смутила функция parse, подумал что скрапи
источник

SS

Stepan Smirnov in Scrapy
что нужно сделать чтобы паук обновил кэш страницы данной url?
источник

К

Кирилл in Scrapy
Stepan Smirnov
что нужно сделать чтобы паук обновил кэш страницы данной url?
прописать dont_cache в мете реквеста
источник

SS

Stepan Smirnov in Scrapy
Кирилл
прописать dont_cache в мете реквеста
разве флаг dont_cache не просто заставляет игнорировать существование кэша (не читать из него и не писать)?
источник

К

Кирилл in Scrapy
Stepan Smirnov
разве флаг dont_cache не просто заставляет игнорировать существование кэша (не читать из него и не писать)?
Да. А по каким условиям ты хочешь обновлять?
источник

SS

Stepan Smirnov in Scrapy
Кирилл
Да. А по каким условиям ты хочешь обновлять?
если response.body состоит из символов "\x00" - обновить кэш.
источник

К

Кирилл in Scrapy
А как ты узнаешь из чего состоит свежий ответ, если ты его не получишь, а получишь тот что в кэше?
источник

К

Кирилл in Scrapy
Может быть ты хочешь не сохранять ответ в кэш если он состоит из этих символов?
источник

SS

Stepan Smirnov in Scrapy
Кирилл
А как ты узнаешь из чего состоит свежий ответ, если ты его не получишь, а получишь тот что в кэше?
страницы обновляются раз в пару лет, ручная проверка показывает, что обновлений не было
источник

SS

Stepan Smirnov in Scrapy
Кирилл
Может быть ты хочешь не сохранять ответ в кэш если он состоит из этих символов?
уже сохранил, хочу обновить
источник

К

Кирилл in Scrapy
Или удали кэш руками, или используй RFC2616Policy если на сайте правильно кэширование настроено, или напиши свой policy
источник

К

Кирилл in Scrapy
Ещё можешь настройку HTTPCACHE_EXPIRATION_SECS установить, на неделю к примеру, будет устаревать
источник

К

Кирилл in Scrapy
Ну или просто реже запускай парсер, толку от него если он одинаковый кэш парсит пол года
источник

A

Andrii in Scrapy
Есть у кого-то секунда для совета? Чего не хватает этому сайту в запросе? (ЮА подкрутил) https://www.overstock.com/Home-Garden/Brother-Cs8800prw-80-Stitch-Project-Runway-Computerized-Home-Sewing-Embroidery-Machine/16794545/product.html
источник

AR

Andrey Rahmatullin in Scrapy
в браузере работает?
источник

A

Andrii in Scrapy
Andrey Rahmatullin
в браузере работает?
Да, даже с вьікл джс
источник

AR

Andrey Rahmatullin in Scrapy
а в скрапи что?
источник