Size: a a a

2020 June 09

МС

Михаил Синегубов... in Scrapy
🎱
как пробросить мету без yield request или как закинуть просто туда значение в другом методе где нет yield request а извлечь в другом где есть?
мляха, у меня остатки могза вскипели 🤯
🤣
источник

I

Ion in Scrapy
Мне нужна помощь, я хочу создать микросервис, который находит новости с разных сайтов по разным ключевым словам и записывает их в базу данных.
этот микросервис должен постоянно работать и искать новости
Можете ли вы посоветовать мне, как я могу это сделать?
источник

AR

Andrey Rahmatullin in Scrapy
разных сайтов, заданных заранее? или сайты он тоже должен искать?
источник

I

Ion in Scrapy
заданных заранее
источник

AR

Andrey Rahmatullin in Scrapy
ну берёшь пишешь сервис
источник

МС

Михаил Синегубов... in Scrapy
Ion
заданных заранее
ну, тут еще овердохрена вопросов возникает. К примеру - на насколько актуальной инфа должна быть? К примеру, обновление раз в пару часов, а может надо "как только появилась новость - сразу должна запоститься".
Вообще, начинать надо с ТЗ. И похрен что это ты сам будешь писать (к примеру). Пишешь на бумажке что ты хочешь получить. Потом бробишь на мелкие задачки, потом  еще на более мелкие. И так пока сам не поймешь что делать.
источник

🎱

🎱 in Scrapy
Andrey Rahmatullin
DUPEFILTER_DEBUG
после включения dupefilter_debug в settings
dupefilter/filtered': 22232  такая стата должна выдаваться в логе?
источник

МС

Михаил Синегубов... in Scrapy
вообще, система "если не знаешь как сделать, попробуй разделить вопрос  на кучу мельких" спасает в 90% ситуациях
источник

МС

Михаил Синегубов... in Scrapy
🎱
после включения dupefilter_debug в settings
dupefilter/filtered': 22232  такая стата должна выдаваться в логе?
вроде еще в логе должны сыпаться сообщения что "урл дубликат..."
источник

🎱

🎱 in Scrapy
Михаил Синегубов
вроде еще в логе должны сыпаться сообщения что "урл дубликат..."
да, тоже читал про это, чет не вижу, странно
источник

AR

Andrey Rahmatullin in Scrapy
🎱
после включения dupefilter_debug в settings
dupefilter/filtered': 22232  такая стата должна выдаваться в логе?
в DEBUG
источник

AR

Andrey Rahmatullin in Scrapy
тьфу
источник

AR

Andrey Rahmatullin in Scrapy
всмысле с этой настройкой в лог пишется каждый скипнутый урл, а не только первый
источник

AR

Andrey Rahmatullin in Scrapy
а стата всегда считается
источник

🎱

🎱 in Scrapy
Andrey Rahmatullin
всмысле с этой настройкой в лог пишется каждый скипнутый урл, а не только первый
да, в settings прописал
DUPEFILTER_DEBUG=True
чет не работает, странно
источник

AR

Andrey Rahmatullin in Scrapy
ну ищи первое сообщение
источник

AR

Andrey Rahmatullin in Scrapy
если настройка выключена, в нём будет написано включите :)
источник

🎱

🎱 in Scrapy
Andrey Rahmatullin
ну ищи первое сообщение
при старте паука?
источник

AR

Andrey Rahmatullin in Scrapy
при первом игнорированном урле, ну
источник

AR

Andrey Rahmatullin in Scrapy
как будто логов не читал, или у тебя логлевел не дебаг?
источник