Size: a a a

2020 May 22

A

Alex in Scrapy
вроде все ок) я ожидал что после 10 страницы сразу закончит работу
источник

AR

Andrey Rahmatullin in Scrapy
не будет же он врать
источник

B

Bulatbulat48 in Scrapy
Alex
вроде все ок) я ожидал что после 10 страницы сразу закончит работу
значит нужно последовательно обрабатывать пагинацию
источник

A

Alex in Scrapy
Bulatbulat48
значит нужно последовательно обрабатывать пагинацию
проверка на пустой список делается на каждом запросе

def _content_checker(self, content):
       if len(content) == 0:
           raise CloseSpider('No more pages with contents!')

def parse(self, response):
       tags = set(response.xpath('//a[@class="tag"]//text()').getall())
       authors = set(response.xpath('//small[@class="author"]//text()').getall())
       text = response.xpath('//div[@class="col-md-8"]//span[@class="text"]//text()').getall()
       QuotesSpider._content_checker(self, authors)
       QuotesSpider._tags_parse(self, tags)
       QuotesSpider._authors_parse(self, authors)
       QuotesSpider._text_parse(self, text)
       with open('tags.txt', 'w') as f:
           f.write(str(QuotesSpider.result))
источник

D

Dmitry in Scrapy
Andrey Rahmatullin
попробуй курлом то же самое
курлом работает
источник

A

Alex in Scrapy
в общем это норма)) и все ок?
источник

AR

Andrey Rahmatullin in Scrapy
Dmitry
курлом работает
с тем же енвваром?
источник

A

Alex in Scrapy
главное что останавливается)
источник

AR

Andrey Rahmatullin in Scrapy
Alex
в общем это норма)) и все ок?
да, CloseSpider не останавливает мгновенно
источник

A

Alex in Scrapy
Andrey Rahmatullin
да, CloseSpider не останавливает мгновенно
спасибо!
источник

D

Dmitry in Scrapy
Andrey Rahmatullin
с тем же енвваром?
да
источник

AR

Andrey Rahmatullin in Scrapy
эм, это не использует енввар
источник

AR

Andrey Rahmatullin in Scrapy
я предлагал без -x
источник

D

Dmitry in Scrapy
Andrey Rahmatullin
я предлагал без -x
без х
источник

AR

Andrey Rahmatullin in Scrapy
нухз, смотреть надо
источник

AR

Andrey Rahmatullin in Scrapy
начни с вайршарка
источник

A

Alex in Scrapy
еще такой вопрос
можно кинуть сюда своего паука?
хотел бы услышать мнения профи) я совсем новичок как в питоне, так и в скрапи)
может я принципиальные ошибки сделал и вообще хрень полная)
https://pastebin.com/8UFuyf2j - ссылка на паучка, пример из доков скрапи
спасибо)
источник

AR

Andrey Rahmatullin in Scrapy
жесть
источник

AR

Andrey Rahmatullin in Scrapy
зачем манипуляции с self.urls? почему результаты пишутся в атрибут класса паука?
источник

AR

Andrey Rahmatullin in Scrapy
методы в питоне вызываются через self
источник