Size: a a a

2020 July 18

AR

Andrey Rahmatullin in Scrapy
Nick Name
а, Окей, допустим.
но я все равно не понял как мне переопределить метод from_crawler, точнее чем мне его надо переопределить, чтобы получить доступ к self.settings в ините моего паука?
В ините никак, написано ж
источник

N

Nick Name in Scrapy
Andrey Rahmatullin
В ините никак, написано ж
там написано, что from_crawler переопределить надо. или я не так понял доку?)
если не так понял, то как мне тогда вызвать определённый метод в начале парсинга? в parse писать как то кривовато выглядит
источник

AR

Andrey Rahmatullin in Scrapy
там написано, что from_crawler переопределить надо, если надо использовать сеттингс до того как __init__ завершится, там не написано что его надо переопределить "чтобы получить доступ к self.settings в ините моего паука"
источник

AR

Andrey Rahmatullin in Scrapy
пиши нужный код в from_crawler
источник

N

Nick Name in Scrapy
Andrey Rahmatullin
пиши нужный код в from_crawler
понял, спасибо, заработало.
но я не понимаю как можно получить имя файла из
scrapy crawl -o filename.csv
в самом коде? FEED_URI_PARAMS показывает None:

ipdb> self.settings.attributes["FEED_URI_PARAMS"].value
2020-07-18 11:51:51 [asyncio] DEBUG: Using selector: EpollSelector
ipdb>
источник

AR

Andrey Rahmatullin in Scrapy
только через argparse
источник

AR

Andrey Rahmatullin in Scrapy
а, вру, в FEEDS оно попадает
источник

N

Nick Name in Scrapy
Andrey Rahmatullin
а, вру, в FEEDS оно попадает
вау, точно. а я раньше смотрел так не было, плохо смотрел. спасибо большое)
источник

AR

Andrey Rahmatullin in Scrapy
ну до этого точно так же попадало в FEED_URI
источник

SS

Stepan Smirnov in Scrapy
Использую такого паука для скачивания pdf-файлов:
https://pastebin.com/sBQn76fN

pipeline:
https://pastebin.com/LtxYactt
источник

SS

Stepan Smirnov in Scrapy
лог
источник

SS

Stepan Smirnov in Scrapy
как файлы записываются
источник

SS

Stepan Smirnov in Scrapy
Что нужно поменять в пайплане(?) чтобы имена файлов писались в UTF-8 (символы " ", "ø", "å" не менялись на "%20", "%C3%B8", "%C3%A5")
источник

К

Кирилл in Scrapy
Stepan Smirnov
Что нужно поменять в пайплане(?) чтобы имена файлов писались в UTF-8 (символы " ", "ø", "å" не менялись на "%20", "%C3%B8", "%C3%A5")
источник

SS

Stepan Smirnov in Scrapy
спасибо
источник

SS

Stepan Smirnov in Scrapy
Stepan Smirnov
Использую такого паука для скачивания pdf-файлов:
https://pastebin.com/sBQn76fN

pipeline:
https://pastebin.com/LtxYactt
мне в этом пауке часто приходится менять значение переменных вручную. Как лучше реализовать их обновление в таком коде? Через чтение файла?
источник

AR

Andrey Rahmatullin in Scrapy
смотря каких переменных
источник

SS

Stepan Smirnov in Scrapy
пути к файлам/папкам, которые создаются другими скриптами
источник

AR

Andrey Rahmatullin in Scrapy
передавай их через -a
источник

AR

Andrey Rahmatullin in Scrapy
хотя смотря как и откуда ты берёшь значения, если только руками копируешь то так, а если их можно считать автоматом - лучше читать автоматом
источник