Телеграмм чат группы scrapy

вроде все ок) я ожидал что после 10 страницы сразу закончит работу

13:49пожаловаться #1

не будет же он врать

13:49пожаловаться #2

Bulatbulat48 in Scrapy

Alex

вроде все ок) я ожидал что после 10 страницы сразу закончит работу

значит нужно последовательно обрабатывать пагинацию

13:49пожаловаться #3

Bulatbulat48

значит нужно последовательно обрабатывать пагинацию

проверка на пустой список делается на каждом запросе

def _content_checker(self, content):
        if len(content) == 0:
            raise CloseSpider('No more pages with contents!')

def parse(self, response):
        tags = set(response.xpath('//a[@class="tag"]//text()').getall())
        authors = set(response.xpath('//small[@class="author"]//text()').getall())
        text = response.xpath('//div[@class="col-md-8"]//span[@class="text"]//text()').getall()
        QuotesSpider._content_checker(self, authors)
        QuotesSpider._tags_parse(self, tags)
        QuotesSpider._authors_parse(self, authors)
        QuotesSpider._text_parse(self, text)
        with open('tags.txt', 'w') as f:
            f.write(str(QuotesSpider.result))

13:51пожаловаться #4

Dmitry in Scrapy

попробуй курлом то же самое

курлом работает

13:51пожаловаться #5

в общем это норма)) и все ок?

13:51пожаловаться #6

Dmitry

курлом работает

с тем же енвваром?

13:51пожаловаться #7

главное что останавливается)

13:52пожаловаться #8

Alex

в общем это норма)) и все ок?

да, CloseSpider не останавливает мгновенно

13:52пожаловаться #9

да, CloseSpider не останавливает мгновенно

спасибо!

13:52пожаловаться #10

Dmitry in Scrapy

с тем же енвваром?

да

13:53пожаловаться #11

эм, это не использует енввар

13:53пожаловаться #12

я предлагал без -x

13:54пожаловаться #13

Dmitry in Scrapy

я предлагал без -x

без х

13:55пожаловаться #14

нухз, смотреть надо

13:55пожаловаться #15

начни с вайршарка

13:55пожаловаться #16

еще такой вопрос
можно кинуть сюда своего паука?
хотел бы услышать мнения профи) я совсем новичок как в питоне, так и в скрапи)
может я принципиальные ошибки сделал и вообще хрень полная)
https://pastebin.com/8UFuyf2j - ссылка на паучка, пример из доков скрапи
спасибо)

13:57пожаловаться #17

жесть

13:58пожаловаться #18

зачем манипуляции с self.urls? почему результаты пишутся в атрибут класса паука?

13:58пожаловаться #19

методы в питоне вызываются через self