Size: a a a

2020 July 16

К

Кирилл in Scrapy
Не усложняй себе жизнь. Тебе на блюдечке дают данные, а ты хочешь рендерить через js, а потом парсить
источник

МП

Максим Петров... in Scrapy
спасибо
источник

К

Кирилл in Scrapy
На крайний случай, если ты там делаешь какое-то супер gui для парсинга, и тебе не важна скорость и сами данные, а чтоб пользователь визуально видел что он выбирает, тогда можно селениум использовать, если сплеш не справляется
источник

МП

Максим Петров... in Scrapy
Спасибо посмотрю.
источник

t

tfhx8 in Scrapy
Прочитал эту статью:
источник

t

tfhx8 in Scrapy
источник

t

tfhx8 in Scrapy
В ней используют селениум. Я так понимаю парсится будетв одном потоке?
источник

К

Кирилл in Scrapy
Да
источник

t

tfhx8 in Scrapy
получается многопоток как в обычном режиме уже не будет работать?
источник

AR

Andrey Rahmatullin in Scrapy
скрапи однопоточен
источник

t

tfhx8 in Scrapy
интересно почему так?
источник

VB

Vladyslav Babych in Scrapy
потому-что так
источник

VB

Vladyslav Babych in Scrapy
он асинхронный
источник

t

tfhx8 in Scrapy
Vladyslav Babych
он асинхронный
а если будет использоваться селениум, то уже не асинхронно будет?
источник

t

tfhx8 in Scrapy
В теории конечно можно запускать несколько спайдеров,но тут им на вход видимо нужно давать очередь, чтобы они на одни и те же урлы не заходили?
источник

AR

Andrey Rahmatullin in Scrapy
а чо мешает асинхронно? сунуть его в deferToThread
источник

AR

Andrey Rahmatullin in Scrapy
time.sleep убрать конечно
источник

AR

Andrey Rahmatullin in Scrapy
в гугле правда никто так не делает
источник

AR

Andrey Rahmatullin in Scrapy
(но это ничего не значит)
источник

t

tfhx8 in Scrapy
Andrey Rahmatullin
а чо мешает асинхронно? сунуть его в deferToThread
может и сработает
источник