Телеграмм чат группы scrapy

Size: a a a

Scrapy

504 membersпожаловаться на группу

2020 June 08

Andrii in Scrapy

SoHard 🎄

а каким боком тут скрапи?

Ну извините за офтоп, но видимо таким же как и 99% вопросов о как правильно сформировать xpath

источник

14:32пожаловаться #1

Oleg Shleiko in Scrapy

Приветствую всех. Подскажите пожалуйста, есть ли способ запустить паука и не закрывать. Сделать как-то так что бы он делал запрос на урлы, парсил, снова запрос и т.д.

Все время добавляй новые запросы

источник

14:34пожаловаться #3

Oleg Shleiko in Scrapy

Кирилл

Все время добавляй новые запросы

а как? Он же start_requests запустит и привет

источник

14:35пожаловаться #4

Andrey Rahmatullin in Scrapy

через schedule()

источник

14:35пожаловаться #5

Stepan Smirnov in Scrapy

а как добавить ссылку к концу очереди в пауке? start_requests.append() сработает?

источник

14:36пожаловаться #6

Andrey Rahmatullin in Scrapy

и это вроде было в доке прямо отдельным абзацем, но я не уверен

источник

14:36пожаловаться #7

Andrey Rahmatullin in Scrapy

Stepan Smirnov

а как добавить ссылку к концу очереди в пауке? start_requests.append() сработает?

через schedule()

а как добавить ссылку к концу очереди в пауке? start_requests.append() сработает?

источник

15:00пожаловаться #9

Bulatbulat48 in Scrapy

@den.joint

ну там же не синхронно ссылки берутся, поэтому если нужно именно самым последним проверить то сувать ему свой idle или spider_close. Но может что-то и есть другое.

источник

15:02пожаловаться #10

Alex in Scrapy

def __init__(self):
        self.profile = webdriver.FirefoxProfile()
        self.profile.set_preference("intl.accept_languages", "ua_RU")
        self.profile.set_preference("dom.disable_open_during_load", False)
        self.fireFoxOptions = webdriver.FirefoxOptions()
        self.fireFoxOptions.set_headless()
        self.driver = webdriver.Firefox(firefox_profile=self.profile, firefox_options=self.fireFoxOptions)

подскажите правильно ли я описал настройки?
вроде все работает но какое то чувство, что где то я накосячил)

источник

17:49пожаловаться #11

🎱

🎱 in Scrapy

тяну с апи данные и сохраняю в item и делаю yield item, когда паук заканчивает работу, лог выдает такое

[scrapy.extensions.logstats] INFO: Crawled 874 pages (at 398 pages/min), scraped 0 items (at 0 items/min)

и никакие данные не сохраняются, в чем может быть проблема?

источник

19:36пожаловаться #12

Andrey Rahmatullin in Scrapy

вопросы должны были возникнуть когда в логе не обнаружилось Scraped from

источник

19:38пожаловаться #13

Andrey Rahmatullin in Scrapy

дебаж код

источник

19:38пожаловаться #14

🎱

🎱 in Scrapy

Andrey Rahmatullin

вопросы должны были возникнуть когда в логе не обнаружилось Scraped from

скрейпит всего 137 страниц в конце, а страниц там 22к

источник

19:39пожаловаться #15

🎱

🎱 in Scrapy

пытаюсь дебажить, пока не получается

источник

19:39пожаловаться #16

Andrey Rahmatullin in Scrapy

до yield item доходит или нет?

источник

19:39пожаловаться #17

🎱

🎱 in Scrapy

Andrey Rahmatullin

до yield item доходит или нет?

нет, кажется понял в чем дело

источник

19:43пожаловаться #18

Andrey Rahmatullin in Scrapy

а ведь этот вопрос стоило задать себе в первую очередь

источник

19:43пожаловаться #19

🎱

🎱 in Scrapy

Andrey Rahmatullin

а ведь этот вопрос стоило задать себе в первую очередь

да, не подумал...
спасибо.

источник

19:44пожаловаться #20