Телеграмм чат группы scrapy_python страница 1396

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Scrapy

439 membersпожаловаться на группу

2020 April 16

VB

Vladyslav Babych in Scrapy

Andrey Rahmatullin

сунуть это в def parse, а в start_requests реквестить какой-нибудь ненужный урл

Мне старт реквест тогда вообще не нужен

источник

18:03пожаловаться #1

VB

Vladyslav Babych in Scrapy

Просто логику переместить в parse?

источник

18:03пожаловаться #2

AR

Andrey Rahmatullin in Scrapy

в таком случае достаточно start_urls, да

источник

18:03пожаловаться #3

VB

Vladyslav Babych in Scrapy

Andrey Rahmatullin

в таком случае достаточно start_urls, да

Не сильно помогло. Самое интересное что он на 2 минуте показывает пик порядка 40 items/min. А потом по 20 тянет

источник

18:31пожаловаться #4

B

Bulatbulat48 in Scrapy

а самописный с какой скоростью вначале и потом?

источник

19:30пожаловаться #5

VB

Vladyslav Babych in Scrapy

Этих деталей я незнаю

источник

19:32пожаловаться #6

И

Илья in Scrapy

есть где то куча примеров пауков, с использованием как можно большего функционала ?

источник

20:44пожаловаться #7

i

ildar in Scrapy

Vladyslav Babych

Не сильно помогло. Самое интересное что он на 2 минуте показывает пик порядка 40 items/min. А потом по 20 тянет

А по бегая по кэшированным данным какую скорость показывает?

источник

20:53пожаловаться #8

VB

Vladyslav Babych in Scrapy

А по бегая по кэшированным данным какую скорость показывает?

Не больше 50 в минуту

источник

21:05пожаловаться #9

VB

Vladyslav Babych in Scrapy

Сколько потоков я бы не запускал

источник

21:05пожаловаться #10

i

ildar in Scrapy

Где-то ты мощно ошибаешься значит, если на кешированных данных выдает 50 в минуту. На какой машине ты это запускаешь? Проц, память?

источник

21:08пожаловаться #11

М

Мак in Scrapy

Причём тут потоки??

источник

21:08пожаловаться #12

М

Мак in Scrapy

Кэш - это ж практически моментально...

источник

21:09пожаловаться #13

М

Мак in Scrapy

Где-то ты мощно ошибаешься значит, если на кешированных данных выдает 50 в минуту. На какой машине ты это запускаешь? Проц, память?

По любому где то жуткий тормоз в коде стоит

источник

21:11пожаловаться #14

i

ildar in Scrapy

Я не знаю почему он к ним так привязан, обычно с одного IP есть какой-то оптимал потоков, выше которого наоборот, начинается замедление

источник

21:11пожаловаться #15

i

ildar in Scrapy

И да, на кэшированных данных все эти download delay не используются и должно выдавать в идеале где-то 3-4к итемов в минуту на относительно хорошей машине (аля какой-нить i5/ryzen/xeon). А кэш на SSD?

источник

21:13пожаловаться #16

М

Мак in Scrapy

И, чего за потоки то? У скрапи один же поток вроде

источник

21:14пожаловаться #17

i

ildar in Scrapy

Он про настройки concurrent

источник

21:14пожаловаться #18

i

ildar in Scrapy

Короче ударился в какие-то микро оптимизации, а при этом там в коде где-то засел глобальный косяк, 50 айтемов в минуту на кэшированных данных, из кэша, это оочень медленно.

источник

21:17пожаловаться #19

М

Мак in Scrapy

Нафиг их вообще трогать, тем более в сторону увеличения...

источник

21:17пожаловаться #20