Телеграмм чат группы scrapy

13:56пожаловаться #1

🎅B

🎅 Austin Bluethy in Scrapy

Не туда писал

13:56пожаловаться #2

🎅B

🎅 Austin Bluethy in Scrapy

Сори

Михаил Синегубов... in Scrapy

13:56пожаловаться #3

МС

🎅 Austin Bluethy

А блин. Тупанул

да я же и не против совсем 😂,

13:58пожаловаться #4

2020 June 02

🎱

🎱

есть https://www.baldor.com/catalog#category=242 сайт с разными категориями.
он тянет данные с помощью апи.

https://www.baldor.com/api/products?include=results&language=en-US&include=filters&include=category&pageSize=10&category=242

Матчей продуктов может быть ~10k.
в запросе апи есть query string с параметром pageSize.
Насколько корректно запрашивать сразу большое кол-во матчей? (в коде я запрашиваю сразу 10к матчей)

f'{self.api_url}products?include=results&pageSize={10**4}&category={int(category_page)}&brand=2

нужно сохранить response.body, но на сайте, на странице листинга продуктов, запрашиваются данные с помощью апи. Если сделать response.body то он будет одинаковым для всех продуктов. (В результатах апи есть ссылка на саму страницу)

Вопрос, думаю обработать отдельным реквестом саму страницу продукта и сохранить респонсом тело страницы, может есть другие варианты ?

12:02пожаловаться #5

чо

12:03пожаловаться #6

🎱

чо

https://www.baldor.com/catalog#category=308
есть такая страница с листингом 515 продуктов.

Мне нужно для каждого продукта сохранить его response.body

12:04пожаловаться #7

"Мне нужно для каждого продукта сохранить response.body, но их не существует, что мне сохранять вместо них"

12:05пожаловаться #8

ну ок чо

Михаил Синегубов... in Scrapy

12:05пожаловаться #9

МС

🎱

браузер, в смысле сплеш пуппитер и всякая такая фигня :)

12:05пожаловаться #10

🎱

ну ок чо

если зайти в Product detail, то будет тело.
Вот и думаю, слать для каждой страницы реквест и сохранять отдельно?

12:06пожаловаться #11

ну заходи, чо

12:07пожаловаться #12

🎱

Михаил Синегубов

браузер, в смысле сплеш пуппитер и всякая такая фигня :)

хм, сейчас попробую погуглить

12:07пожаловаться #13

только сначала ты писал про листинг, а теперь про страницы продуктов

12:07пожаловаться #14

🎱

только сначала ты писал про листинг, а теперь про страницы продуктов

да, со страницы листинга нужно выцепить все response.body на страницы продуктов. Сорри, не до конца раскрыл мысль

12:08пожаловаться #15

для этого, очевидно, надо запрашивать страницы продуктов

12:09пожаловаться #16

не знаю как ещё можно сохранить страницу не запрашивая страницу

12:09пожаловаться #17

🎱

для этого, очевидно, надо запрашивать страницы продуктов

понял, ну мб были другие способы о которых я не знал.
спасибо

12:09пожаловаться #18

🎱

а можно в скрапи отправить request и получить response не создавая доп метод для этого, без колбеков?
например, у меня есть url
и я хочу что-то типа такого

get_body = get('http://www.someurl').text

16:09пожаловаться #19

🎱

или заюзать requests ?