Size: a a a

2020 July 26

AS

Anatolii Shaitanov in Scrapy
Andrii
Нарисуй на бумаге схему
рисовал , я не знаю почему мне проходится циклом
источник

SS

Stepan Smirnov in Scrapy
Andrii
Нарисуй на бумаге схему
а в какой нотации рекомендуете рисовать?
источник

A

Andrii in Scrapy
Stepan Smirnov
а в какой нотации рекомендуете рисовать?
Что б понять что с чем и когда взаимодействует
источник

И

Илья in Scrapy
Не помню спрашивал тут или нет. Есть сайт с товарами. Есть паук с двумя функциями parse. Первая собирает данные со списка, вторая проходит по ссылке и собирает в карточке товара. Есть пайплайн в Mysql базу через sqlalchemy. Задача состоит в том, чтобы при каждодневном скрапинге минимизировать свое присутствие на сайте. Проверить изменился ли товар можно и на странице со списком. Нужно как то как то проверить есть ли такой урл в базе и не изменились ли у него параметры. Вопрос в какой части прописывать данный функционал ? И как его правильней реализовать ?
источник

И

Илья in Scrapy
соответственно если параметры не изменились, то дропаем итем и идем к следующему , если изменились, то проходим по ссылке и продолжаем парсить
источник

AR

Andrey Rahmatullin in Scrapy
Мидлварь, process_request
источник

AS

Anatolii Shaitanov in Scrapy
Andrii
Что б понять что с чем и когда взаимодействует
лучше подскажи как завернуть правильно)0))
источник

И

Илья in Scrapy
Andrey Rahmatullin
Мидлварь, process_request
чуть чуть подробнее пожалуйста, строчки три четыре хотяб
источник

AR

Andrey Rahmatullin in Scrapy
Увы
источник

AS

Anatolii Shaitanov in Scrapy
так кто-то можете подсказать как завернуть в цикл следующий код?
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
page = driver.find_element_by_css_selector("a[class='c-pagination__link js-pagination-link ']")
page.click()
источник

A

Andrii in Scrapy
Anatolii Shaitanov
так кто-то можете подсказать как завернуть в цикл следующий код?
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
page = driver.find_element_by_css_selector("a[class='c-pagination__link js-pagination-link ']")
page.click()
while True:
           try:
 driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
 page = driver.find_element_by_css_selector("a[class='c-pagination__link js-pagination-link ']")
 page.click()
           except Exception:
               break
источник

AR

Andrey Rahmatullin in Scrapy
😹
источник

AS

Anatolii Shaitanov in Scrapy
Andrii
while True:
           try:
 driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
 page = driver.find_element_by_css_selector("a[class='c-pagination__link js-pagination-link ']")
 page.click()
           except Exception:
               break
жесть))
источник

К

Кирилл in Scrapy
Норм
источник

V

Viktor in Scrapy
Anatolii Shaitanov
жесть))
Только не вставляй в ide)
источник

AS

Anatolii Shaitanov in Scrapy
Viktor
Только не вставляй в ide)
я в pycharm
источник

AS

Anatolii Shaitanov in Scrapy
Andrii
while True:
           try:
 driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
 page = driver.find_element_by_css_selector("a[class='c-pagination__link js-pagination-link ']")
 page.click()
           except Exception:
               break
скрипт заканчивает работать на второй странице снизу
источник

V

Viktor in Scrapy
Anatolii Shaitanov
я в pycharm
А пайчарм не ide?)
источник

AS

Anatolii Shaitanov in Scrapy
Viktor
А пайчарм не ide?)
а да, сори
источник

AS

Anatolii Shaitanov in Scrapy
Viktor
Только не вставляй в ide)
тогда почему?
источник