Size: a a a

2020 May 22

AR

Andrey Rahmatullin in Scrapy
страницы надо перебирать парсингом, а не дописыванием номера в урл
источник

B

Bulatbulat48 in Scrapy
+ запись в файл scrapy crawl spidername.py -o file.csv -t csv
источник

AR

Andrey Rahmatullin in Scrapy
что в методах _*_parse я честно говоря не понял, наверняка это всё делается гораздо проще
источник

AR

Andrey Rahmatullin in Scrapy
а, и красиво конечно сделано перезаписывание результата
источник

A

Alex in Scrapy
спасибо) буду дальше учиться
источник

AR

Andrey Rahmatullin in Scrapy
т.е. мы храним всё всегда и на каждом проходе пишем всё целиком, перезаписывая файл
источник

A

Alex in Scrapy
Andrey Rahmatullin
т.е. мы храним всё всегда и на каждом проходе пишем всё целиком, перезаписывая файл
согласен, не совсем правильно)
источник

A

Alex in Scrapy
да действительно нагородил жесть)
спасибо ребятки за помощь!
источник

SS

Stepan Smirnov in Scrapy
Вопрос: как рекомендуется рендерить JS с сервера? Docker+Splash? Или есть что то более простое/подходящее?
источник

AR

Andrey Rahmatullin in Scrapy
рекомендуется его не рендерить
источник

AR

Andrey Rahmatullin in Scrapy
если сильно надо - сплеш, если сплеш не справляется - доставать нормальные хедлесс браузеры
источник

VB

Vladyslav Babych in Scrapy
   def start_requests(self):
       return self.parse(None)

   def parse(self, response):
       if self.start_urls:
           for url in self.start_urls_:

Если такая логика обработки, очередь не будет поломанной?
источник

К

Кирилл in Scrapy
зачем такое делать?
источник

VB

Vladyslav Babych in Scrapy
У меня вместе с урлом идёт дополнительная инфа к нему
источник

VB

Vladyslav Babych in Scrapy
Я не могу просто список урлов задать
источник

AR

Andrey Rahmatullin in Scrapy
зачем называть это parse если это не коллбэк
источник

AR

Andrey Rahmatullin in Scrapy
ну и конечно это ничем не отличается от пихания этого в start_requests напрямую
источник

AR

Andrey Rahmatullin in Scrapy
start_urls кстати необязательно переименовывать
источник

VB

Vladyslav Babych in Scrapy
Как мне тогда провернуть?
источник

AR

Andrey Rahmatullin in Scrapy
перечитать что я писал, там написано
источник