Size: a a a

2020 April 07

VB

Vladyslav Babych in Scrapy
https://gist.github.com/c01e5d8311dca296c48d5f5f4b09ed0a Понадобилось мне изменить настройки при запуске скрипта. Но почему-то после всех действий внутри паука та и после процесса получаю старые значения. Почему это может быть?
источник

М

Мак in Scrapy
Мак
при использовании SplashRequest, при настройке dont_filter=True, параметры повторного запроса (в том числе и метаданные, почему то) судя по всему берутся кешированные. Как можно это дело настроить? мне необходимо чтоб именно мета передавалась разная...
никто не подскажет?
источник

МС

Михаил Синегубов in Scrapy
Мак
никто не подскажет?
кэш чей, у скрапи кеширование настроено?
источник

М

Мак in Scrapy
нет
источник

МС

Михаил Синегубов in Scrapy
Vladyslav Babych
https://gist.github.com/c01e5d8311dca296c48d5f5f4b09ed0a Понадобилось мне изменить настройки при запуске скрипта. Но почему-то после всех действий внутри паука та и после процесса получаю старые значения. Почему это может быть?
сугубо мое ИМХО
1. ты изменяешь экземпляр настроек, потом опять считываешь настройки проекта и пыфтаешся прочитать.... так они же не изменяются
2. внутри паука, подозреваю что читаешь в init дока, вроде, рекомендует использовать from_crawler для чтения настроек...
источник

VB

Vladyslav Babych in Scrapy
Михаил Синегубов
сугубо мое ИМХО
1. ты изменяешь экземпляр настроек, потом опять считываешь настройки проекта и пыфтаешся прочитать.... так они же не изменяются
2. внутри паука, подозреваю что читаешь в init дока, вроде, рекомендует использовать from_crawler для чтения настроек...
Но разве обьект настроек не синглтрон?
источник

МС

Михаил Синегубов in Scrapy
Vladyslav Babych
Но разве обьект настроек не синглтрон?
хз, я таких умных словов не знаю 😂.
по правде, я не читал настройки после работы паука
источник

К

Кирилл in Scrapy
Vladyslav Babych
Но разве обьект настроек не синглтрон?
почему ты так думаешь?
источник

VB

Vladyslav Babych in Scrapy
Я так предполагаю
источник

i

ildar in Scrapy
смутно помню когда я пилил последовательный запуск 2х роутеров, выяснилось, что на-лету их после создания объекта паука уже так просто не сменишь
источник

i

ildar in Scrapy
раннер же включает в себя всю машинерию с миддлварями и прочим, если надо поменять что-то, что только при инициализации задаётся, то только пересоздавать
источник

i

ildar in Scrapy
а если нет то просто сунуть в кастом_сеттингс паука или инициализировать из аргумента
источник

i

ildar in Scrapy
FEED_URI, тем не менее, читается один раз, при создании scrapy.extensions.feedexport.FeedExporter
источник

i

ildar in Scrapy
keyword arguments to initialize the spider это то, что передаётся в scrapy crawl через -a
источник

i

ildar in Scrapy
и принимается в __init__
источник

i

ildar in Scrapy
а через runner.settings можно задать?
источник

i

ildar in Scrapy
типа, runner.settings=settings_non_ed
источник

i

ildar in Scrapy
можно, но не поможет
источник

i

ildar in Scrapy
ну можно сделать экспортер, который читает настройку не в __init__, но вы ещё эту настройку в него потом передайте
источник

i

ildar in Scrapy
Vladyslav Babych
Я так предполагаю
вот, я когда-то тоже хотел неизведанного...
источник