Size: a a a

2021 February 14

i

i in Scrapy
где там этото FAQ от Булата?
источник

К

Кирилл in Scrapy
i
где там этото FAQ от Булата?
В закрепе
источник

H

Harsh in Scrapy
i
btw crawlera had some problems with AUTOTHROTTLE
Oh. That's heads-up. Thanks. :)
источник

H

Harsh in Scrapy
i
я очень хочу в скрапи поддержку js-рендера искаропки. Относительно легко подключаемую. Без танцев с бубном на splash (дело даже не в докере, а то, что он юзает движок не по-стандарту индустрии), а на чем-то вроде playwright/selenium+chrome/firefox,
Hahaha.
источник

i

i in Scrapy
I remember Bulatbulat48 had some problems with it on scrapinghub hosting, but it was a loooong time ago: https://github.com/bulatbulat48/ru-scrapy-python/blob/master/README.md
источник

H

Harsh in Scrapy
I haven't tried scrapy playwright. seems interesting
источник

i

i in Scrapy
Hm, seems it was not problem, it was just already some auto delays by default? Dunno:
Хостинг Scrapinghub по дефолту стоит задержка, нужно отключать в настройках AUTOTHROTTLE_ENABLED чекбокс False
источник

К

Кирилл in Scrapy
i
я очень хочу в скрапи поддержку js-рендера искаропки. Относительно легко подключаемую. Без танцев с бубном на splash (дело даже не в докере, а то, что он юзает движок не по-стандарту индустрии), а на чем-то вроде playwright/selenium+chrome/firefox,
Не думаю что такое будет, это было бы совмещение разных проектов. Сейчас же речь идет только о скрапи, насколько понимаю
источник

i

i in Scrapy
тогда
источник

i

i in Scrapy
источник

К

Кирилл in Scrapy
ох, ты прям мемчик писал
источник

i

i in Scrapy
где мой кэш на лям запросов на 100 файлов? ыыыыы( (плачу уже 3 года, раз в год)
источник

К

Кирилл in Scrapy
i
тогда
источник

i

i in Scrapy
пока нет, в последнее время я что-то навострился имитировать чего там  js из себя изображает тупо запросами, но иной раз тааак надоедает.
источник

i

i in Scrapy
А с другой стороны, иногда вообще легкотня попадается, типа добавил cookies = {"beget": "begetok"} и все обратно заработало 😊
источник

К

Кирилл in Scrapy
i
А с другой стороны, иногда вообще легкотня попадается, типа добавил cookies = {"beget": "begetok"} и все обратно заработало 😊
и CF challange имитируешь?)
источник

i

i in Scrapy
я даже не знаю чего это)
источник

i

i in Scrapy
а, cloudfare
источник

К

Кирилл in Scrapy
да
источник

i

i in Scrapy
а вообще, ничего нет страшнее, чем тупо сервер, который еле дышит и отдает 5 запросов в минуту, сколько ты потоков не делай и со скольки ip не лезь.
источник