Size: a a a

2020 March 17

AB

Alexander B in Scrapy
как можно попроще в пауке редиректы задетекитить хочу пагинацию в лоб делать, аля в цикле инкрементировать f'?page={i}' и если редирект, то break. Знаю про meta = {'dont_redirect': True,}, как бы это прикрутить?
источник

AB

Alexander B in Scrapy
а, можно чекать чекать response.status == 302
источник

МС

Михаил Синегубов in Scrapy
Boris Krutskih
А можете еще подсказать, чем отличается использование scrapy от библеотеки requests, в scrapy насколько я понял больше всяких готовых фич?
реквест - голая либа для HTTP запросов
скрапи:
1. запросы
2. очередь запросов
3. повторы при ошибочных запросах
4. сохранение результатов в файл (в т.ч. очередь при сохранении)
5. организация парсинга
6. несколько типов файла результата "из коробки"
7. кеширование страниц "из коробки"
8. фильтр дубликатов старниц "из коробки"

все, я задолбался писать :)
источник

МС

Михаил Синегубов in Scrapy
Alexander B
а, можно чекать чекать response.status == 302
тока добавь 302 в список обрабатываемых кодов
источник

AB

Alexander B in Scrapy
Boris Krutskih
А можете еще подсказать, чем отличается использование scrapy от библеотеки requests, в scrapy насколько я понял больше всяких готовых фич?
requests - пистолет, scrapy - зенитная установка
источник

AB

Alexander B in Scrapy
Михаил Синегубов
тока добавь 302 в список обрабатываемых кодов
понял
источник

AR

Andrey Rahmatullin in Scrapy
Alexander B
как можно попроще в пауке редиректы задетекитить хочу пагинацию в лоб делать, аля в цикле инкрементировать f'?page={i}' и если редирект, то break. Знаю про meta = {'dont_redirect': True,}, как бы это прикрутить?
А как ты в цикле узнаешь что редирект? inline_requests?
источник

AB

Alexander B in Scrapy
рекурсивно думаю как нить)
источник

AB

Alexander B in Scrapy
ща
источник

AB

Alexander B in Scrapy
надо это обкурить)
источник

AR

Andrey Rahmatullin in Scrapy
Ну да, второй вариант рекурсия
источник

AB

Alexander B in Scrapy
как то так наверное
источник

AR

Andrey Rahmatullin in Scrapy
Угу
источник
2020 March 18

A

Andrii in Scrapy
Порекомендуйте, который лучше использовать headless браузер?
источник

A

Andrii in Scrapy
источник

М

Мак in Scrapy
все юзали
источник

М

Мак in Scrapy
удобная либа, но не поддерживает прокси
источник

S

Sergey in Scrapy
Мак
удобная либа, но не поддерживает прокси
Да, я когда ее юзал. Ставил 3proxy локально, пускал весь трафик через localhost, а он редиректир на нормальный proxy
источник

A

Andrii in Scrapy
а что щас юзаете?
источник

A

Andrii in Scrapy
селениум хедлес?
источник