Size: a a a

2020 May 25

РТ

Ренат Турсунбаев... in Scrapy
smeshny 🏍🏂🥽🏋️‍♂️
Добрый день! Подскажите, может кто решал вопрос:
если после некоторого количества запросов сервер начинает кидать 302 редирект и редиректить на каптчу, то как заставить скрапи заснуть на 5 минут и начать с того же места?
стаковерфло прочитал вдоль и поперек)
Может просто запускать паука с сохранением прогресса, и при 302-х закрывать его? А потом, через 5 минут снова запускать)
источник

РТ

Ренат Турсунбаев... in Scrapy
Или может настроить тротлинг, delay ....
источник

s

smeshny 🏍🏂🥽🏋️‍♂️... in Scrapy
Ренат Турсунбаев
Или может настроить тротлинг, delay ....
вот с троттлингом на стаковерфло и рекоменуют играться.
источник

B

Bulatbulat48 in Scrapy
Гнида Черножопая
Переслано от Гнида Черножопая
В чем может быть проблема, не подскажете?

1 скрин - bot.py, telebot
2 скрин - user_client.py, telethon

Трейс ошибки: https://pastebin.com/m9Se7mrS
На сколько знаю есть группа по ботам в телеграме, может там подскажут.
источник

К

Кирилл in Scrapy
smeshny 🏍🏂🥽🏋️‍♂️
Добрый день! Подскажите, может кто решал вопрос:
если после некоторого количества запросов сервер начинает кидать 302 редирект и редиректить на каптчу, то как заставить скрапи заснуть на 5 минут и начать с того же места?
стаковерфло прочитал вдоль и поперек)
Конечно смотря какая капча, но скорее всего 5 минут не спасут
источник

AR

Andrey Rahmatullin in Scrapy
ага
источник

AR

Andrey Rahmatullin in Scrapy
smeshny 🏍🏂🥽🏋️‍♂️
Добрый день! Подскажите, может кто решал вопрос:
если после некоторого количества запросов сервер начинает кидать 302 редирект и редиректить на каптчу, то как заставить скрапи заснуть на 5 минут и начать с того же места?
стаковерфло прочитал вдоль и поперек)
ип-то один и тот же? лучше б прокси менять в этом случае
источник

s

smeshny 🏍🏂🥽🏋️‍♂️... in Scrapy
Andrey Rahmatullin
ип-то один и тот же? лучше б прокси менять в этом случае
прокси в ротации
источник

AR

Andrey Rahmatullin in Scrapy
если с другого прокси запрос отправлять, то зачем ждать? серверу ж не видно что это снова ты
источник

AR

Andrey Rahmatullin in Scrapy
а если видно, то это другая проблема
источник

МС

Михаил Синегубов... in Scrapy
от любят, как я посмотрю, люди "полную" информацию давать :)
источник

s

smeshny 🏍🏂🥽🏋️‍♂️... in Scrapy
Andrey Rahmatullin
а если видно, то это другая проблема
возможно
только пока не могу определить какая.

пока настраиваю тротлинг.
просто сервер начинает брыкаться не сразу

а минут через 40
источник

У

Уруруборос Иванович... in Scrapy
Ты дал продолжения 3.5 часа :3
Так мило
источник

У

Уруруборос Иванович... in Scrapy
источник

У

Уруруборос Иванович... in Scrapy
Есть у меня пара тупых вопросов. Задам из чуть позже - надо рутинную работу разобрать :(
источник

К

Кирилл in Scrapy
держи в курсе
источник

У

Уруруборос Иванович... in Scrapy
Кирилл
держи в курсе
источник

D

Dmitry in Scrapy
Злой баг, видимо к @wrar42, потому что по ветке asyncio-startrequests-asyncgen. На винде + python 3.7.2 все работает. Решил уже залить в продакш на линукс бокс (python 3.8.2) и под шампанское разрезать ленточку, но не тут-то было - падает с совершенно неинформативным трейсом:
источник

D

Dmitry in Scrapy
2020-05-25 12:10:17 [scrapy] ERROR: Error while obtaining start requests
Traceback (most recent call last):
 File "/home/darker/.local/lib/python3.8/site-packages/scrapy/core/engine.py", line 135, in _next_request
   request = yield deferred_from_coro(slot.start_requests.anext())
 File "/usr/lib/python3.8/site-packages/twisted/internet/defer.py", line 824, in adapt
   extracted = result.result()
RuntimeError: anext(): asynchronous generator is already running
2020-05-25 12:10:17 [scrapy] INFO: Closing spider (finished)
источник

AR

Andrey Rahmatullin in Scrapy
в 3.8 хрень, да
источник