Size: a a a

2020 March 17

AR

Andrey Rahmatullin in Scrapy
" Добавить сайт для парсинга" ээ чо
источник

AR

Andrey Rahmatullin in Scrapy
оно само будет спайдер писать?
источник

МС

Михаил Синегубов in Scrapy
ну, это тогда да, тогда свое пилить....
запуск - тут, скорее всего, scrapyd, хотя, можено и из любоко питонового скрипта запутить... Только будут проблемы с паузами/прерываниями, скорее всего.
сравнивание/выгрузка - это тянет за собой базу...
"сайт добавить" - это типа заявки будет? паука сам будешь пистаь?
источник

BK

Boris Krutskih in Scrapy
Andrey Rahmatullin
" Добавить сайт для парсинга" ээ чо
добавить магазин для парсинга вернее)
магазины заранее будут подготовлены
источник

МС

Михаил Синегубов in Scrapy
Boris Krutskih
добавить магазин для парсинга вернее)
магазины заранее будут подготовлены
так может "выбрать магазин"? :)
и да, если будет какой то ограниченный список магазинов, тогда точно есть смысл в в базе, только будет вопрос хранения данных. Я бы написал "данные а базе обновляются автоматически" :).
источник

BK

Boris Krutskih in Scrapy
Михаил Синегубов
так может "выбрать магазин"? :)
и да, если будет какой то ограниченный список магазинов, тогда точно есть смысл в в базе, только будет вопрос хранения данных. Я бы написал "данные а базе обновляются автоматически" :).
может тогда если клиентская часть будет на реакте допустим, стоит использовать что-то типа такого? вместо джанги? https://fastapi.tiangolo.com/
источник

МС

Михаил Синегубов in Scrapy
в общем, мое мнение - бакэнд, та же джанга (по большому счету пофиг что именно),
но обязательно выключить комп, взять стовку бумаги и долго и упорно писать/рисовать. Что бы сформировалось в мозгах "а что собственно хочется"
источник

МС

Михаил Синегубов in Scrapy
Boris Krutskih
может тогда если клиентская часть будет на реакте допустим, стоит использовать что-то типа такого? вместо джанги? https://fastapi.tiangolo.com/
я тебе уже ответил. Пофиг на чем у тебя будет бэк, если сможешь паука из него запустить.
Одна из двух оболочек (что выше бросал) написана на GO
источник

К

Кирилл in Scrapy
@wrar42 А в scrapyd планируют сделать фичу с регулярным запуском?
источник

AR

Andrey Rahmatullin in Scrapy
не слышал чтобы в scrapyd что-то планировали
источник

AR

Andrey Rahmatullin in Scrapy
я даже не знаю кто его пишет
источник

BK

Boris Krutskih in Scrapy
Михаил Синегубов
я тебе уже ответил. Пофиг на чем у тебя будет бэк, если сможешь паука из него запустить.
Одна из двух оболочек (что выше бросал) написана на GO
несовсем понял за этот момент
Одна из двух оболочек (что выше бросал) написана на GO
источник

i

ildar in Scrapy
Может кто пробовал какие-нибудь workflow pipelines и ему понравилось(или наоборот)?
источник

МС

Михаил Синегубов in Scrapy
Boris Krutskih
несовсем понял за этот момент
Одна из двух оболочек (что выше бросал) написана на GO
https://github.com/crawlab-team/crawlab - вот это написано на GO, но так же работает с питоновыми пауками, и со скрапи в том числе...
источник

i

ildar in Scrapy
/workflow frameworks/ETL frameworks, вот это все
источник

BK

Boris Krutskih in Scrapy
А можете еще подсказать, чем отличается использование scrapy от библеотеки requests, в scrapy насколько я понял больше всяких готовых фич?
источник

AR

Andrey Rahmatullin in Scrapy
ну ээ всем
источник

AR

Andrey Rahmatullin in Scrapy
в requests ты руками делаешь реквест и руками же его обрабатываешь
источник

AR

Andrey Rahmatullin in Scrapy
причём синхронно лол
источник

AR

Andrey Rahmatullin in Scrapy
можно сказать что где-то в глубине внутри скрапи есть кусок кода, аналогичный requests
источник