а как можно проверять, мой код yield { 'Text': data.css('div > p > a::attr(title)').get(), 'Link': data.css('div.product-item__i > p > a::attr(href)').get(), 'Price': data.css('div.price-box__content-i .price-value::text').get() } примерчик если можно)
понял. спасибо. это надо т.е перед проходом парсера, открывать файл и все post_id в set размещать? и делать проверку? а не знаешь, что будет быстрее на таких обьемах, открывать csv ил json?
понял. спасибо. это надо т.е перед проходом парсера, открывать файл и все post_id в set размещать? и делать проверку? а не знаешь, что будет быстрее на таких обьемах, открывать csv ил json?
Да, на открытии паука читаешь файл, добавляешь все айдишники в переменную паука с типом set. Или csv или jl(json lines), так как их можно читать построчно. Но это все human readable форматы, в сравнении с другими они все равно будут менее удобным