Size: a a a

2020 June 01

🎅B

🎅 Austin Bluethy in Scrapy
А блин. Тупанул
источник

🎅B

🎅 Austin Bluethy in Scrapy
Не туда писал
источник

🎅B

🎅 Austin Bluethy in Scrapy
Сори
источник

МС

Михаил Синегубов... in Scrapy
🎅 Austin Bluethy
А блин. Тупанул
да я же и не против совсем 😂,
источник
2020 June 02

🎱

🎱 in Scrapy
🎱
есть https://www.baldor.com/catalog#category=242 сайт с разными категориями.
он тянет данные с помощью апи.  
https://www.baldor.com/api/products?include=results&language=en-US&include=filters&include=category&pageSize=10&category=242

Матчей продуктов может быть ~10k.
в запросе апи есть query string с параметром  pageSize.
Насколько корректно запрашивать сразу большое кол-во матчей? (в коде я запрашиваю сразу 10к матчей)
f'{self.api_url}products?include=results&pageSize={10**4}&category={int(category_page)}&brand=2
нужно сохранить response.body, но на сайте, на странице листинга продуктов, запрашиваются данные с помощью апи. Если сделать response.body то он будет одинаковым для всех продуктов. (В результатах апи есть ссылка на саму страницу)

Вопрос, думаю обработать отдельным реквестом саму страницу продукта и сохранить респонсом тело страницы, может есть другие варианты ?
источник

AR

Andrey Rahmatullin in Scrapy
чо
источник

🎱

🎱 in Scrapy
https://www.baldor.com/catalog#category=308
есть такая страница с листингом 515 продуктов.

Мне нужно для каждого продукта сохранить его response.body
источник

AR

Andrey Rahmatullin in Scrapy
"Мне нужно для каждого продукта сохранить response.body, но их не существует, что мне сохранять вместо них"
источник

AR

Andrey Rahmatullin in Scrapy
ну ок чо
источник

МС

Михаил Синегубов... in Scrapy
🎱
нужно сохранить response.body, но на сайте, на странице листинга продуктов, запрашиваются данные с помощью апи. Если сделать response.body то он будет одинаковым для всех продуктов. (В результатах апи есть ссылка на саму страницу)

Вопрос, думаю обработать отдельным реквестом саму страницу продукта и сохранить респонсом тело страницы, может есть другие варианты ?
браузер, в смысле сплеш пуппитер и всякая такая фигня :)
источник

🎱

🎱 in Scrapy
Andrey Rahmatullin
ну ок чо
если зайти в Product detail, то будет тело.
Вот и думаю, слать для каждой страницы реквест и сохранять отдельно?
источник

AR

Andrey Rahmatullin in Scrapy
ну заходи, чо
источник

🎱

🎱 in Scrapy
Михаил Синегубов
браузер, в смысле сплеш пуппитер и всякая такая фигня :)
хм, сейчас попробую погуглить
источник

AR

Andrey Rahmatullin in Scrapy
только сначала ты писал про листинг, а теперь про страницы продуктов
источник

🎱

🎱 in Scrapy
Andrey Rahmatullin
только сначала ты писал про листинг, а теперь про страницы продуктов
да, со страницы листинга нужно выцепить все response.body на страницы продуктов. Сорри, не до конца раскрыл мысль
источник

AR

Andrey Rahmatullin in Scrapy
для этого, очевидно, надо запрашивать страницы продуктов
источник

AR

Andrey Rahmatullin in Scrapy
не знаю как ещё можно сохранить страницу не запрашивая страницу
источник

🎱

🎱 in Scrapy
Andrey Rahmatullin
для этого, очевидно, надо запрашивать страницы продуктов
понял, ну мб были другие способы о которых я не знал.
спасибо
источник

🎱

🎱 in Scrapy
а можно в скрапи отправить request и получить response не создавая доп метод для этого, без колбеков?
например, у меня есть url
и я хочу что-то типа такого
get_body = get('http://www.someurl').text
источник

🎱

🎱 in Scrapy
или заюзать requests ?
источник