Телеграмм чат группы scrapy_python страница 1626

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Scrapy

501 membersпожаловаться на группу

2020 June 05

DM

Dima Moiseenko in Scrapy

хелло,
пытаюсь создать custom extension, чтобы с помощью basic_consume(pika) брать url из очереди и передавать экземпляр Request с этим url в планировщик crawler.engine.crawl(request, spider)

может у кого-то была практика с таким?

источник

15:36пожаловаться #1

iz

izzz zzi in Scrapy

хелло,
пытаюсь создать custom extension, чтобы с помощью basic_consume(pika) брать url из очереди и передавать экземпляр Request с этим url в планировщик crawler.engine.crawl(request, spider)

может у кого-то была практика с таким?

В старт_юлр?

источник

15:38пожаловаться #2

AR

Andrey Rahmatullin in Scrapy

написано ж куда

источник

15:38пожаловаться #3

AR

Andrey Rahmatullin in Scrapy

пика не про редис же

источник

15:42пожаловаться #4

К

Кирилл in Scrapy

да, я что-то не то прочитал

источник

15:42пожаловаться #5

DM

Dima Moiseenko in Scrapy

вообще вся логика такова:
- запускаю паука с extension в котором вызываю
raise DontCloseSpider()
чтобы он все время работал
- запускается scrapy команду, которая будет посылать urls с помощью pika
- а extension о котором я написал выше должен их уже принимать и создавать экземпляр Request с этим url в планировщик
вот последнее вообще не в зуб ногой ка реализовать

источник

15:48пожаловаться #6

AR

Andrey Rahmatullin in Scrapy

а в чём затык?

источник

15:48пожаловаться #7

AR

Andrey Rahmatullin in Scrapy

типа как поллить очередь изнутри экстенжена?

источник

15:49пожаловаться #8

AR

Andrey Rahmatullin in Scrapy

вообще тут кто-то уже интегрировался с пикой вроде, не знаю насколько успешно

источник

15:50пожаловаться #9

AR

Andrey Rahmatullin in Scrapy

пика деферреды-то умеет?

источник

15:50пожаловаться #10

DM

Dima Moiseenko in Scrapy

Andrey Rahmatullin

а в чём затык?

принять - принимаю url, а как добавить его в планировщик не могу понять

источник

15:50пожаловаться #11

OS

Oleg Shleiko in Scrapy

хелло,
пытаюсь создать custom extension, чтобы с помощью basic_consume(pika) брать url из очереди и передавать экземпляр Request с этим url в планировщик crawler.engine.crawl(request, spider)

может у кого-то была практика с таким?

Может у меня и говнопрактика, но я делаю так
1) сделал себе RabbitmqHelper и создаю его объект в свойстве паука
2) в start_requests получаю сообщение из очереди с помощью RabbitmqHelper
3) формирую на основе этого сообщения урл и в Request

источник

15:50пожаловаться #12

AR

Andrey Rahmatullin in Scrapy

принять - принимаю url, а как добавить его в планировщик не могу понять

но ведь в вопросе написано "crawler.engine.crawl(request, spider)"

источник

15:50пожаловаться #13

DM

Dima Moiseenko in Scrapy

Andrey Rahmatullin

но ведь в вопросе написано "crawler.engine.crawl(request, spider)"

Это я так пытаюсь сделать, но ничего не происходит, паук начал работу и просто не прекращает

источник

15:56пожаловаться #14

AR

Andrey Rahmatullin in Scrapy

Ну что не прекращает это вроде так и задумано?

источник

15:57пожаловаться #15

DM

Dima Moiseenko in Scrapy

Andrey Rahmatullin

Ну что не прекращает это вроде так и задумано?

Одна из задумок
Вторая задумка - принимать url, делать экземпляр Request с ним и отправлять в планиррвщик

источник

15:58пожаловаться #16

AR

Andrey Rahmatullin in Scrapy

ну

источник

15:59пожаловаться #17

AR

Andrey Rahmatullin in Scrapy

логи читал?

источник

15:59пожаловаться #18

DM

Dima Moiseenko in Scrapy

Andrey Rahmatullin

пика деферреды-то умеет?

умеет

источник

16:06пожаловаться #19

AC

Amber Claes in Scrapy

Здравствуйте, раньше писал на скрепи (около года назад), недавно понадобился ещё раз, но я чота охренел.
Зашёл вспомнить quickstart, а там добавили какой-то кластер с 3мя мониторами и запуском с-под докера.
1) Так ли полезны эти мониторы
2) Обязательно ли использовать кластер
3) Если уже есть паук, написанный под старой версией, на новую его можно переписать без кластера?

источник

21:30пожаловаться #20