Size: a a a

2020 June 08

A

Andrii in Scrapy
SoHard 🎄
а каким боком тут скрапи?
Ну извините за офтоп, но видимо таким же как и 99% вопросов о как правильно сформировать xpath
источник

OS

Oleg Shleiko in Scrapy
Приветствую всех. Подскажите пожалуйста, есть ли способ запустить паука и не закрывать. Сделать как-то так что бы он делал запрос на урлы, парсил, снова запрос и т.д.
источник

К

Кирилл in Scrapy
Oleg Shleiko
Приветствую всех. Подскажите пожалуйста, есть ли способ запустить паука и не закрывать. Сделать как-то так что бы он делал запрос на урлы, парсил, снова запрос и т.д.
Все время добавляй новые запросы
источник

OS

Oleg Shleiko in Scrapy
Кирилл
Все время добавляй новые запросы
а как? Он же start_requests запустит и привет
источник

AR

Andrey Rahmatullin in Scrapy
через schedule()
источник

SS

Stepan Smirnov in Scrapy
а как добавить ссылку к концу очереди в пауке? start_requests.append() сработает?
источник

AR

Andrey Rahmatullin in Scrapy
и это вроде было в доке прямо отдельным абзацем, но я не уверен
источник

AR

Andrey Rahmatullin in Scrapy
Stepan Smirnov
а как добавить ссылку к концу очереди в пауке? start_requests.append() сработает?
через schedule()
источник

@

@den.joint in Scrapy
Stepan Smirnov
а как добавить ссылку к концу очереди в пауке? start_requests.append() сработает?
источник

B

Bulatbulat48 in Scrapy
ну там же не синхронно ссылки берутся, поэтому если нужно именно самым последним проверить то сувать ему свой idle или spider_close. Но может что-то и есть другое.
источник

A

Alex in Scrapy
def __init__(self):
       self.profile = webdriver.FirefoxProfile()
       self.profile.set_preference("intl.accept_languages", "ua_RU")
       self.profile.set_preference("dom.disable_open_during_load", False)
       self.fireFoxOptions = webdriver.FirefoxOptions()
       self.fireFoxOptions.set_headless()
       self.driver = webdriver.Firefox(firefox_profile=self.profile, firefox_options=self.fireFoxOptions)

подскажите правильно ли я описал настройки?
вроде все работает но какое то чувство, что где то я накосячил)
источник

🎱

🎱 in Scrapy
тяну с апи данные и сохраняю в item и делаю yield item, когда паук заканчивает работу, лог выдает такое
[scrapy.extensions.logstats] INFO: Crawled 874 pages (at 398 pages/min), scraped 0 items (at 0 items/min)
и никакие данные не сохраняются, в чем может быть проблема?
источник

AR

Andrey Rahmatullin in Scrapy
вопросы должны были возникнуть когда в логе не обнаружилось Scraped from
источник

AR

Andrey Rahmatullin in Scrapy
дебаж код
источник

🎱

🎱 in Scrapy
Andrey Rahmatullin
вопросы должны были возникнуть когда в логе не обнаружилось Scraped from
скрейпит всего 137 страниц в конце, а страниц там 22к
источник

🎱

🎱 in Scrapy
пытаюсь дебажить, пока не получается
источник

AR

Andrey Rahmatullin in Scrapy
до yield item доходит или нет?
источник

🎱

🎱 in Scrapy
Andrey Rahmatullin
до yield item доходит или нет?
нет,  кажется понял в чем дело
источник

AR

Andrey Rahmatullin in Scrapy
а ведь этот вопрос стоило задать себе в первую очередь
источник

🎱

🎱 in Scrapy
Andrey Rahmatullin
а ведь этот вопрос стоило задать себе в первую очередь
да, не подумал...
спасибо.
источник