Size: a a a

2020 April 09

AC

Alexander Chaptykov in Scrapy
ок, спасибо! мне щас идти нужно
источник

AB

Alexander B in Scrapy
Alexander Chaptykov
а в мидлвер что прописано?
там ничего не прописано, на то scrapy_selenium и нужен....
источник

V

Vitalii in Scrapy
Вопрос по питону
Можно от трай ексепт использовать в цикле ?
источник

AC

Alexander Chaptykov in Scrapy
Alexander B
там ничего не прописано, на то scrapy_selenium и нужен....
у меня он плохо парсил и я от него отказался, т.е. просто не парсит некоторые домены
источник

AB

Alexander B in Scrapy
ну буду попробовать через свою мидлварю
источник

К

Кирилл in Scrapy
Vitalii
Вопрос по питону
Можно от трай ексепт использовать в цикле ?
Почему нет?
источник

🎱

🎱 in Scrapy
подскажите плз, если в пагинации линк на след страницу такого вида, то  
href="javascript:__doPostBack('ctl00$cphMainContent$gvSearchResults','Page$2')"

как правильно извлекать в таком случае?
источник

AR

Andrey Rahmatullin in Scrapy
слать пост
источник

Д

Данил in Scrapy
🎱
подскажите плз, если в пагинации линк на след страницу такого вида, то  
href="javascript:__doPostBack('ctl00$cphMainContent$gvSearchResults','Page$2')"

как правильно извлекать в таком случае?
Скиньте метод __doPostBack
источник

Д

Данил in Scrapy
Еще есть варик вручную добавлять, например так ?page={page_number}, т.е. ?page=1, ?page=2
источник

Д

Данил in Scrapy
Или чекать есть ли переход на следующую страницу и если да, генерировать новый урл
источник

AR

Andrey Rahmatullin in Scrapy
Данил
Скиньте метод __doPostBack
тут два варианта, либо ты видел ASP.NET Web Forms, либо не видел, в обоих случаях скинуть метод не поможет
источник

AR

Andrey Rahmatullin in Scrapy
добавлять что-то в урл, понятное дело, тоже не поможет
источник

Д

Данил in Scrapy
Andrey Rahmatullin
тут два варианта, либо ты видел ASP.NET Web Forms, либо не видел, в обоих случаях скинуть метод не поможет
Понятно. Не сталкивался, поэтому и предложил, сорян)
источник

A

Andrii in Scrapy
Кто знает, openpyxl с csv в excel 200 000 строк без проблем конвертнет?
источник

AC

Alexander Chaptykov in Scrapy
а есть какой нибудь бест-практис код по scrapy который бы включал себя все подходы чтобы была ротация прокси, ротация агентов, ротация спайдеров если не качается домен?
источник

AC

Alexander Chaptykov in Scrapy
просто есть задача спарсить n доменов, и не существует идеального подхода, где-то помогает splash где то селениум, где-то нужно прокси менять
источник

AR

Andrey Rahmatullin in Scrapy
да, crawlera :D
источник

AR

Andrey Rahmatullin in Scrapy
ротация спайдеров это как?
источник

AC

Alexander Chaptykov in Scrapy
ну например у меня один спйадер это селениум а второй это сплэш
источник