Size: a a a

2020 June 17

К

Кирилл in Scrapy
Читай csv, сравнивай значения, отправляй уведомления
источник

К

Кирилл in Scrapy
Но конечно лучше бы использовать бд
источник

VB

Vladyslav Babych in Scrapy
Допусти это всё в БД, как тогда?
источник

К

Кирилл in Scrapy
Ну на закрытии паука делаешь sql запрос, получаешь значения которые тебя интересуют, или там где они изменились и отправляешь уведомление. Можно еще не в пауке, а просто скрипт с регулярным запуском
источник

К

Кирилл in Scrapy
Скорее всего все проверки можно одними запросами в бд сделать, и кодом только отправлять уведомления
источник

К

Кирилл in Scrapy
Еще как fancy вариант для ленивых, использовать stats history у спайдермона типа такого, и пихать туда какие-то значения https://spidermon.readthedocs.io/en/latest/howto/stats-collection.html
источник

R

Roma in Scrapy
Vladyslav Babych
Допусти это всё в БД, как тогда?
Это стандартный pipeline. Скрапи должен скрапить и парсить - он и делает - другой процесс должен проверять - что напаршено и какого качества и отправлять уведомление. Вот и выбирай технологию для этого....Ну по быстрому если надо - то уже выше сказали что использовать\
источник

VB

Vladyslav Babych in Scrapy
Roma
Это стандартный pipeline. Скрапи должен скрапить и парсить - он и делает - другой процесс должен проверять - что напаршено и какого качества и отправлять уведомление. Вот и выбирай технологию для этого....Ну по быстрому если надо - то уже выше сказали что использовать\
мне вот этот другой процесс и интересует
источник

R

Roma in Scrapy
Это не Скрапи уже
источник

VB

Vladyslav Babych in Scrapy
Понимаю, ладно извините, если неправильный вопрос задал
источник

R

Roma in Scrapy
Да просто не в том чате - это уже data engineering...к телеге большой чат есть
источник

VB

Vladyslav Babych in Scrapy
Можно ссылочку в лс?
источник

И

Илья in Scrapy
response.xpath('//ul[contains(@class, "prodAttr")][1]')      не могу понять почему мне один хер несколько значений дает и как мне выбрать первое
источник

К

Кирилл in Scrapy
Vladyslav Babych
Понимаю, ладно извините, если неправильный вопрос задал
Да просто подучить питон и бд. Это элементарные задачи, даже если не знаком с архитектурой скрапи, при знании питона можно просто сбоку пристроится и делать что нужно. А так, выше уже несколько вариантов есть, сделай один из
источник

A

Andrii in Scrapy
Vladyslav Babych
Можно ссылочку в лс?
Может, csv-diff ?)
источник

К

Кирилл in Scrapy
Илья
response.xpath('//ul[contains(@class, "prodAttr")][1]')      не могу понять почему мне один хер несколько значений дает и как мне выбрать первое
.get()
источник

VB

Vladyslav Babych in Scrapy
Кирилл
Да просто подучить питон и бд. Это элементарные задачи, даже если не знаком с архитектурой скрапи, при знании питона можно просто сбоку пристроится и делать что нужно. А так, выше уже несколько вариантов есть, сделай один из
Тут просто чёткой зависимости нет, все элементы могут измениться, так бы я сделал))
источник

И

Илья in Scrapy
там дальше еще xpath есть
источник

VB

Vladyslav Babych in Scrapy
Andrii
Может, csv-diff ?)
Да, что-то подобное и нужно
источник

VB

Vladyslav Babych in Scrapy
Спасибо!
источник