Size: a a a

2020 June 20

OS

Oleg Shleiko in Scrapy
HTTP/1.1 302 Moved temporarily
источник

OS

Oleg Shleiko in Scrapy
я так понимаю 1.1
источник

AR

Andrey Rahmatullin in Scrapy
Тогда не знаю, может паук через прокси?
источник

OS

Oleg Shleiko in Scrapy
да, и курл через прокси
источник

К

Кирилл in Scrapy
Методы одинаковые?
источник

К

Кирилл in Scrapy
Oleg Shleiko
Да какая разница, я вывел что бы протестировать на курле
Гони лень из себя, оно так и происходит, тут переменную плохо назвал, там тесты не дописал, там на ошибку не проверил. Нужно всегда хорошо писать
источник

小东 in Scrapy
hello everyone
источник

A

Alex in Scrapy
Ребятки всем привет)
я наговнокодил паука который дергает телефоны с авито, ну как телефоны. там же картинки вместо телефонов, вот эти картинки и дергает.
все хорошо работает вот только как мне кажется слишком медленно это он делает
в категории 100 страниц по 50 объяв на каждой, в среднем 4900 - 4980 получается картинок.
и вытаскивает это все за 12 часов с одного айпи, с минимальным количеством запросов и паузами
если кто работал с авито, получалось ли обрабатывать такой объём за меньшее количество времени и если да то куда копать, что бы ускорить работу
источник

iz

izzz zzi in Scrapy
Alex
Ребятки всем привет)
я наговнокодил паука который дергает телефоны с авито, ну как телефоны. там же картинки вместо телефонов, вот эти картинки и дергает.
все хорошо работает вот только как мне кажется слишком медленно это он делает
в категории 100 страниц по 50 объяв на каждой, в среднем 4900 - 4980 получается картинок.
и вытаскивает это все за 12 часов с одного айпи, с минимальным количеством запросов и паузами
если кто работал с авито, получалось ли обрабатывать такой объём за меньшее количество времени и если да то куда копать, что бы ускорить работу
Конечно в разы быстрее это собирается
источник

A

Alex in Scrapy
izzz zzi
Конечно в разы быстрее это собирается
а хоть куда копать?
прокси это понятно
хотел обкатать основу, а потом уже через прокси запускать
источник

AR

Andrey Rahmatullin in Scrapy
Уменьшить паузы
источник

iz

izzz zzi in Scrapy
7 объявлений в минута ,62м у них активных объявления , то есть ты их будешь собирать +-15 лет?)
источник

A

Alex in Scrapy
уже некуда уменьшать)
там от 2-3 сек паузы
источник

A

Alex in Scrapy
убирал в некоторых местах паузы и получал бан
источник

A

Alex in Scrapy
izzz zzi
7 объявлений в минута ,62м у них активных объявления , то есть ты их будешь собирать +-15 лет?)
ну это в один поток
да долго(
источник

iz

izzz zzi in Scrapy
Alex
ну это в один поток
да долго(
Для кого-то это пол жизни 😂
источник

AR

Andrey Rahmatullin in Scrapy
Alex
а хоть куда копать?
прокси это понятно
хотел обкатать основу, а потом уже через прокси запускать
Капец логика
источник

A

Alex in Scrapy
Andrey Rahmatullin
Капец логика
а что не так то?
источник

AR

Andrey Rahmatullin in Scrapy
"хочу обкатать основу, скоростью займусь потом" и "хочу скорость" несовместимы
источник

К

Кирилл in Scrapy
Нормальная логика, толку "навалять" с одного IP, и маштабировать, чтоб каждый из сотни прокси работал плохо
источник