Телеграмм чат группы scrapy_python страница 1807

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Scrapy

567 membersпожаловаться на группу

2020 July 23

A

Andrii in Scrapy

Зачем?

источник

14:29пожаловаться #1

💀Ҁ

💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲... in Scrapy

Andrii

Зачем?

ну а как?
1. собираю линки с одной страницы
2. прохожусь по пагинации по всем страницам и делаю 1.
3. на каждой страницы граблю инфу

источник

14:32пожаловаться #2

💀Ҁ

💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲... in Scrapy

я просто хз как "правильно" это реализовать в scrapy
на bs бы сделал без всякого

источник

14:33пожаловаться #3

S

SoHard 🎄 in Scrapy

Andrii

//h3/following-sibling::div[@class='line']

спасибо

источник

14:33пожаловаться #4

A

Andrii in Scrapy

💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲

ну а как?
1. собираю линки с одной страницы
2. прохожусь по пагинации по всем страницам и делаю 1.
3. на каждой страницы граблю инфу

Нарисуй на бумаге :)

источник

14:34пожаловаться #5

A

Andrii in Scrapy

💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲

ну а как?
1. собираю линки с одной страницы
2. прохожусь по пагинации по всем страницам и делаю 1.
3. на каждой страницы граблю инфу

def parse(self, response):
        links = response.xpath("//@href").getall()
 for link in links:
            yield scrapy.Request(url=link , callback=self.parse_links)


    def parse_links(self, response):
        articles = response.xpath("//@href").getall()
 for link in links:
            yield scrapy.Request(url=link , callback=self.parse_data)

 pagination...
            yield scrapy.Request(url=next_page , callback=self.parse_links)

    def parse_data(self, response)
 data ...

источник

14:43пожаловаться #6

A

Andrii in Scrapy

на вскидку

источник

14:43пожаловаться #7

💀Ҁ

💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲... in Scrapy

источник

14:44пожаловаться #8

💀Ҁ

💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲... in Scrapy

спасибо

источник

14:44пожаловаться #9

A

Andrii in Scrapy

На бумаге схему нарисуй и все будет ясно - что с чим взаимодействует

источник

14:44пожаловаться #10

V

Viktor in Scrapy

Andrii

def parse(self, response):
        links = response.xpath("//@href").getall()
 for link in links:
            yield scrapy.Request(url=link , callback=self.parse_links)


    def parse_links(self, response):
        articles = response.xpath("//@href").getall()
 for link in links:
            yield scrapy.Request(url=link , callback=self.parse_data)

 pagination...
            yield scrapy.Request(url=next_page , callback=self.parse_links)

    def parse_data(self, response)
 data ...

Лучше уже CrawlSpider

источник

14:44пожаловаться #11

A

Andrii in Scrapy

Лучше уже CrawlSpider

не хирургично

источник

14:45пожаловаться #12

V

Viktor in Scrapy

Andrii

не хирургично

+

источник

14:45пожаловаться #13

A

Andrii in Scrapy

Andrii

def parse(self, response):
        links = response.xpath("//@href").getall()
 for link in links:
            yield scrapy.Request(url=link , callback=self.parse_links)


    def parse_links(self, response):
        articles = response.xpath("//@href").getall()
 for link in links:
            yield scrapy.Request(url=link , callback=self.parse_data)

 pagination...
            yield scrapy.Request(url=next_page , callback=self.parse_links)

    def parse_data(self, response)
 data ...

может есть лучше конешно способ, ... и более пайтоник, но...)

источник

14:46пожаловаться #14

💀Ҁ

💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲... in Scrapy

Andrii

может есть лучше конешно способ, ... и более пайтоник, но...)

та это вроде как раз в стили scrapy

источник

15:51пожаловаться #15

К

Кирилл in Scrapy

Вообще нет)

источник

15:52пожаловаться #16

AR

Andrey Rahmatullin in Scrapy

да нормально

источник

15:56пожаловаться #17

AR

Andrey Rahmatullin in Scrapy

ну, щас можно (и следовательно нужно) делать yield from response.follow_all()

источник

15:57пожаловаться #18

AR

Andrey Rahmatullin in Scrapy

если Кирилл про CrawlSpider, то я его терпеть не могу

источник

15:59пожаловаться #19

A

Andrii in Scrapy

Andrey Rahmatullin

ну, щас можно (и следовательно нужно) делать yield from response.follow_all()

Вот читал, но еще не делал...надо будет попробовать

источник

16:00пожаловаться #20