Телеграмм чат группы scrapy

Andrey Rahmatullin

и ты среднее время на запрос как считал?

download_latency

17:28пожаловаться #1

это в parse

        self.latency_stats.append(response.meta.get('download_latency'))

17:29пожаловаться #2

send_message(f'Success requests - {len(self.latency_stats)}\n'
                     f'Min latency - {min(self.latency_stats)} s.\n'
                     f'Max latency - {max(self.latency_stats)} s.\n'
                     f'Average latency - {sum(self.latency_stats) / len(self.latency_stats)} s.\n'
                     f'Summary latency - {sum(self.latency_stats)} s.')

а это результат в closed

17:29пожаловаться #3

Andrey Rahmatullin

и ты среднее время на запрос как считал?

Есть хотя-бы идеи почему так может быть?

17:32пожаловаться #4

Vladyslav Babych

Вот я вообще не понимаю в чём я ошибаюсь. У меня на 1 запрос в среднем уходит 15 секунд. При идеальных условиях за минуту я должен с 1 рекурентным запросом получить 4 страницы, с 40 - 160 верно? Но я получаю максимум 40

И насколько это правильно?

17:33пожаловаться #5

хз, смотреть надо

17:34пожаловаться #6

может там нет 40 готовых урлов в каждый момент времени, потому что логика последовательная

17:34пожаловаться #7

Andrey Rahmatullin

может там нет 40 готовых урлов в каждый момент времени, потому что логика последовательная

Они изначально есть

17:34пожаловаться #8

из start_requests что ли?

17:35пожаловаться #9

Да

17:35пожаловаться #10

        for url in self.start_url:

17:35пожаловаться #11

ну так start_requests не так процессится, как коллбэки

17:35пожаловаться #12

перетащи это всё в parse для начала

17:35пожаловаться #13

    def start_requests(self):
        for url in self.start_url:
            yield scrapy.Request(url)

типо это вынести в отдельную функцию?

17:36пожаловаться #14

А потом

    def start_requests(self):
        yield self.custom_start_requests()

17:39пожаловаться #15

Ребят кто нибудь занимался парсингом сайтов букмекерских контор ?

17:45пожаловаться #16

Lex in Scrapy

r4khic

Ребят кто нибудь занимался парсингом сайтов букмекерских контор ?

есть такой опыт, в чем вопрос?

17:45пожаловаться #17

Lex

есть такой опыт, в чем вопрос?

Я хотел по-обычному спарсить .Но не все так просто.Тот сайт который я хочу спарсить,данные подгружает их не на прямую а ajax'ом как я понял.И вот вопрос как лучше парсить такие сайты?

17:46пожаловаться #18

Апи вряд-ли они дают

17:46пожаловаться #19

на пример бк олимп