Size: a a a

2020 December 14

AR

Andrey Rahmatullin in Scrapy
item pipeline всё-таки
источник

К

Кирилл in Scrapy
Stepan Smirnov
В FilesPipeline можно как-то передать в errorback/поймать в какой-то другой функции  
'retry/reason_count/twisted.internet.error.ConnectionRefusedError,
'retry/reason_count/twisted.internet.error.DNSLookupError',
'retry/reason_count/twisted.internet.error.TCPTimedOutError'
?
Или для нужно переписывать retry middleware?
Чтоб ошибка дошла в errback пайплайна, нужно чтоб никакой миделвер её не перехватывал и не обрабатывал
источник

AR

Andrey Rahmatullin in Scrapy
errback пайплайна?
источник

К

Кирилл in Scrapy
это же медиа пайплайн, он там через engine шлет запросы и цепляет media_downloaded и media_failed к дэфэрэду
источник

AR

Andrey Rahmatullin in Scrapy
так то медиа
источник

AR

Andrey Rahmatullin in Scrapy
но я вопроса вообще не понял
источник

К

Кирилл in Scrapy
Я так понял, что нужно перечисленные исключения обрабатывать в media_failed
источник

AR

Andrey Rahmatullin in Scrapy
ага, тогда да
источник

AB

Arkady B in Scrapy
Кирилл
Я так понял, что нужно перечисленные исключения обрабатывать в media_failed
Привет!
источник

AB

Arkady B in Scrapy
Парни, подскажите плиз, как настроить https://github.com/clemfromspace/scrapy-selenium
такая проблема, что scrapy не хочет ни как подключаться к remote селениуму и говорит:
WARNING: Disabled SeleniumMiddleware: SELENIUM_DRIVER_NAME and SELENIUM_DRIVER_EXECUTABLE_PATH must be set

дело в том, что я выставляю настройки
SELENIUM_DRIVER_NAME = 'chrome'
SELENIUM_COMMAND_EXECUTOR = 'http://127.0.0.1:4444/wd/hub'
SELENIUM_DRIVER_ARGUMENTS = ['--headless']
как он хочет, но без результата
источник

AR

Andrey Rahmatullin in Scrapy
не там выставляешь, возможно
источник

AB

Arkady B in Scrapy
Andrey Rahmatullin
не там выставляешь, возможно
интересно, а где еще можно выставить кроме как в settings.py?
источник

AR

Andrey Rahmatullin in Scrapy
🤷‍♂️
источник

AR

Andrey Rahmatullin in Scrapy
а, ты про SELENIUM_DRIVER_EXECUTABLE_PATH забыл
источник

AB

Arkady B in Scrapy
Andrey Rahmatullin
а, ты про SELENIUM_DRIVER_EXECUTABLE_PATH забыл
так зачем он мне, если я remote использую
источник

AR

Andrey Rahmatullin in Scrapy
ну нет так нет
источник

AB

Arkady B in Scrapy
Andrey Rahmatullin
ну нет так нет
))
источник

AB

Arkady B in Scrapy
Andrey Rahmatullin
ну нет так нет
ты пытался, спасибо
источник

AR

Andrey Rahmatullin in Scrapy
пытался что? я указал почему такая ошибка
источник

AB

Arkady B in Scrapy
Andrey Rahmatullin
пытался что? я указал почему такая ошибка
ок, что нужно установить в SELENIUM_DRIVER_EXECUTABLE_PATH если я использую в докере standalone chrome?
источник