Size: a a a

2021 January 21

DO

Daniil Okhlopkov in Scrapy
не, ну в код DAG'ов Airflow можно конечно положить код scrapy и запускать через обычный PythonExecutor, но чем-то мне этот подход не нравится.
источник

DO

Daniil Okhlopkov in Scrapy
Можно запустить scrapy в режиме вебсервиса с Rest API, по которому он получит параметры для парсинга, а вернет потом полотно с json?
источник

AR

Andrey Rahmatullin in Scrapy
ScrapyRT
источник

DO

Daniil Okhlopkov in Scrapy
спасибо) он же нормально отрабатывает, когда нужно запустить Селениум тоже?
источник

AR

Andrey Rahmatullin in Scrapy
без понятия
источник

DO

Daniil Okhlopkov in Scrapy
А кто-нибудь использовал https://github.com/aerokube/selenoid в связке с скрапи?
источник

R

Roma in Scrapy
а вопрос какой?
источник

DO

Daniil Okhlopkov in Scrapy
Roma
а вопрос какой?
вопрос, насколько выгоднее его использовать в сравнении с scrapy-selenium? То есть стоит ли заморочиться настроить, чтобы потом кайфовать, или кайфов не будет
источник

R

Roma in Scrapy
если делаешь продакшн решение - то конечно стоит
источник

R

Roma in Scrapy
это ж веб драйвер в контейнере
источник

R

Roma in Scrapy
масштабируемое решение
источник

DO

Daniil Okhlopkov in Scrapy
Roma
если делаешь продакшн решение - то конечно стоит
во! Спасибо!

А я использую немного переделанный вебдрайвер, из которого выннули все палевные кусочки. Возможно ли в solenoid запихнуть свой файлик вебдрайвера? Или там только стандартные
источник

R

Roma in Scrapy
скрапи-селениум - это ж просто пакет для работы с вебдрайвером....Это обычный вебдрайвер - все тоже самое....Незнаю что у тебя там особенного - все так же конфигурируется
источник

R

Roma in Scrapy
источник

R

Roma in Scrapy
как то вот так делал
источник

i

i in Scrapy
поищи по чату. кто-то тут его не раз рекламировал емнип.
источник

i

i in Scrapy
А, ну вот Roma и рекламил)
источник

R

Roma in Scrapy
Хорошее масштабируемое решение
источник

R

Roma in Scrapy
2 года - стоит на проде - полет нормальный - ваще никакого гемора не доставляло
источник

i

i in Scrapy
Возможно, кстати, airflow это оверкилл для только запуска скрапи, если ты его еще не собрался встраивать в какой-нибудь процесс аля CRM, типа данные эти грузятся, потом загружаются куда-то и проворачиваются. Я на аирфлоу смотрю т.к. у меня парсинг это только кусочек айсберга)
источник