Size: a a a

2021 January 29

AR

Andrey Rahmatullin in Scrapy
Ну и скорость всё равно в скорость сервера упирается
источник

S

SoHard 🎄 in Scrapy
Andrii
Кто-то замерял если ли разница в скорости скрапинга если запускать его из допустим пайчарма или из wsl?
не считая того что пичарм захавает 1гиг оперативки разницы нет)
источник

A

Andrii in Scrapy
источник

A

Andrii in Scrapy
Ето запущено два пайчарма, 50 елементов в минуту скрепит
источник

A

Andrii in Scrapy
Запустил из wsl 170+
источник

AR

Andrey Rahmatullin in Scrapy
Чо к чему
источник

К

Кирилл in Scrapy
Дескрипторы, это файловые дескрипторы?
источник

AR

Andrey Rahmatullin in Scrapy
Ещё и экран фоткать 🤦‍♂
источник

A

Andrii in Scrapy
Andrey Rahmatullin
Ещё и экран фоткать 🤦‍♂
Делать скриншот, кидать на почту, качать и кидать в телеграм?
источник

A

Andrii in Scrapy
🤷‍♂
источник

К

Кирилл in Scrapy
Harsh
Otherwise it'll be big change to move to apify for puppeteer based automation. It may come to that too, yet in not recent future
puppeteer will not help you with captchas, but you can use selenium and pyppeteer with scrapy also, why not
источник

К

Кирилл in Scrapy
of course, without scrapy build-in requests but other architecture will still
источник

H

Harsh in Scrapy
Кирилл
puppeteer will not help you with captchas, but you can use selenium and pyppeteer with scrapy also, why not
Yes. It won't help with captcha. It'll make the button clicking etc easier I guess.

The idea is too get more control over what's going on when there's captcha involved.
Currently crawlers are XHR/Spalsh based.
источник

К

Кирилл in Scrapy
for example this integration with selenium  for some cases is good enough https://github.com/clemfromspace/scrapy-selenium
источник

H

Harsh in Scrapy
👌 thanks sir. I'll check it out. 😄
источник
2021 January 30

GM

Georgina Miranda in Scrapy
источник

R

Roma in Scrapy
Andrii
Кто-то замерял если ли разница в скорости скрапинга если запускать его из допустим пайчарма или из wsl?
На скорость память не влияет, но вот опытным путем пришел что памяти много не бывает, особенно тем кто работают с данными, щас что не приложение то дохера памяти надо, помнится мне что сраный Скайп брал по 300мб, щас на смену ему в пришел тимс, та же херня, по 500-700мб жрет , пайчарму тоже дофига памяти надо, у самого по 2-3 инстанса работают, 16гб уже маловато как то
источник

i

i in Scrapy
Andrii
Кто-то замерял если ли разница в скорости скрапинга если запускать его из допустим пайчарма или из wsl?
как-то не интересовался, но вообще,  не мешает в pycharm посмотреть на параметры памяти, проверить, что они у тебя на запуске не превышаются  и выдать ему побольше оперативки, потому-что там начальные значения древние и учитывают многие слабые системы или с небольшой памятью,  во вкладке help там Change Memory Settings и более подробно edit custom vm options, индикатор памяти включается через пкм на статус баре. https://www.jetbrains.com/help/idea/increasing-memory-heap.html
https://www.jetbrains.com/help/pycharm/tuning-the-ide.html#configure-platform-properties
источник

i

i in Scrapy
Andrii
Делать скриншот, кидать на почту, качать и кидать в телеграм?
поставь себе какой-нибудь greenshot или sharex, а в винде 10 вообще есть инструмент ножницы
источник

AR

Andrey Rahmatullin in Scrapy
i
как-то не интересовался, но вообще,  не мешает в pycharm посмотреть на параметры памяти, проверить, что они у тебя на запуске не превышаются  и выдать ему побольше оперативки, потому-что там начальные значения древние и учитывают многие слабые системы или с небольшой памятью,  во вкладке help там Change Memory Settings и более подробно edit custom vm options, индикатор памяти включается через пкм на статус баре. https://www.jetbrains.com/help/idea/increasing-memory-heap.html
https://www.jetbrains.com/help/pycharm/tuning-the-ide.html#configure-platform-properties
Но ведь скрапи это отдельный процесс
источник