Size: a a a

2020 December 18

OS

Oleg Shleiko in Scrapy
Если вы о php, то у меня на рабочем проекте что бы держать 850 рабочих парсеров используется 4 сервера по 8 потоков ядер и 64 ГБ озу. В пиках парсинга сервера не справляются
источник

S

Shaman89 in Scrapy
Михаил Синегубов
и кстати, насчет протца. А сколько при 4к потоков тебе надо построить парсеров в памяти? от они совсем протц не нагружают, ага
Ну я лично запускал 1.5к максимум 2к на vps 30гб озу 8 ядер проц.
источник

S

Shaman89 in Scrapy
5 парсеров работало
источник

AR

Andrey Rahmatullin in Scrapy
и все сидели упёршись в прокси
источник

К

Кирилл in Scrapy
Мы о каких потоках говорим? тредах или "потоках" запросов?
источник

S

Shaman89 in Scrapy
Запросов
источник

AR

Andrey Rahmatullin in Scrapy
ой лол
источник

AR

Andrey Rahmatullin in Scrapy
дальше без меня
источник

AR

Andrey Rahmatullin in Scrapy
> Работа с прокси и в многопотоке(ориентировочно до 4к потоков).
источник

К

Кирилл in Scrapy
Тогда понятно почему проц не важен)
источник

МС

Михаил Синегубов... in Scrapy
Shaman89
Запросов
какая скорость была на 1,5-2к потоков?
источник

S

Shaman89 in Scrapy
Ну отлично раз всем все понятно и все уже похихикали то теперь поясните нубу что к чему
источник

AR

Andrey Rahmatullin in Scrapy
поясняю: ты сразу зашёл с кривой формулировкой
источник

AR

Andrey Rahmatullin in Scrapy
теперь ясно что у тебя самый обычный небольшой проект, и скрапи туда подойдёт без вопросов
источник

AR

Andrey Rahmatullin in Scrapy
и никаких невероятных гигов памяти конечно не надо
источник

S

Shaman89 in Scrapy
Спасибо).
источник

МС

Михаил Синегубов... in Scrapy
Shaman89
Ну отлично раз всем все понятно и все уже похихикали то теперь поясните нубу что к чему
ну и я свои 5 копеек вставлю.
относительно недавно парисил валдберрис, если без записи в базу, спокойно держало 6000 рпм (так сказать, идеал). С записью 4000 рпм. Это, максимуму 50 параллельных запросов.
за сутки, получается, спокойно можно сделать ~5,7млн запросов
источник

МС

Михаил Синегубов... in Scrapy
и это, никаких "4к потоков".
источник

К

Кирилл in Scrapy
Михаил Синегубов
ну и я свои 5 копеек вставлю.
относительно недавно парисил валдберрис, если без записи в базу, спокойно держало 6000 рпм (так сказать, идеал). С записью 4000 рпм. Это, максимуму 50 параллельных запросов.
за сутки, получается, спокойно можно сделать ~5,7млн запросов
по нашей терминологии, у тебя вроде было 50 потоков
источник

МС

Михаил Синегубов... in Scrapy
Кирилл
по нашей терминологии, у тебя вроде было 50 потоков
ну ок, потоков
источник