Size: a a a

2021 February 11

AR

Andrey Rahmatullin in Scrapy
что добавлять?
источник

A

Andrii in Scrapy
первьій цьікл закончился на 50, а я хочу что б другой продолжил добавлять нумерацию 51,52,53...
источник

AR

Andrey Rahmatullin in Scrapy
учитывая что ты знаешь, что enumerate принимает начальное значение, в чём вопрос?
источник

К

Кирилл in Scrapy
Если я правильно понял, можно попробовать добавить это https://docs.python.org/3/library/itertools.html#itertools.chain.from_iterable
источник

G

Georgiy in Scrapy
Bral Bral
https://docs.scrapy.org/en/latest/_modules/scrapy/pipelines/files.html?highlight=defer  Нужно методы класса  FilesPipeline(MediaPipeline) переопределить ?
Загружать видеофайлы средствами scrapy - очень плохая затея.
scrapy не умеет streaming. Для загрузки каждого файла средствами scrapy понадобится что бы файл целиком поместился в оперативную память (с учетом особенностей реализации некоторых частей scrapy - 2 или даже 3 раза).
И, соответственно, в случае параллельной загрузки нескольких файлов потребление оперативной памяти также пропорционально увеличится.
Видимо именно поэтому в новом pipeline появился get из requests в режиме streaming=True (что бы предотвратить перерасход оперативной памяти).
Так как тут используется вызов синхронного requests.get внутри асинхронного scrapy - соответственно requests.get остановит приложение до момента полной загрузки файла.
источник
2021 February 12

AR

Andrey Rahmatullin in Scrapy
Тогда ковыряться с deferToThread наверно
источник

BB

Bral Bral in Scrapy
Благодарю за ответы, действительно, когда начал переопределять методы класса FilesPipeline(MediaPipeline), стартануло несколько скачиваний, но и потребление памяти возросло.

А если стартовать несколько спайдеров, где в каждом будет стриминг загрузка внутри

https://stackoverflow.com/questions/39365131/running-multiple-spiders-in-scrapy-for-1-website-in-parallel
источник

AR

Andrey Rahmatullin in Scrapy
Если тред один, то не поможет
источник

NS

Nikolay Semenov in Scrapy
Помогите, пожалуйста! Хочу сделать парсинг, но перед этим нужно заполнить форму. Как реализовать это?
источник

A

Andrii in Scrapy
Nikolay Semenov
Помогите, пожалуйста! Хочу сделать парсинг, но перед этим нужно заполнить форму. Как реализовать это?
Селениум
источник

AP

Alex Python in Scrapy
ну да, самое простое это selenium webdriver
источник

AP

Alex Python in Scrapy
ибо requests для новичка слишком сложно )
источник

A

Andrii in Scrapy
Всем привет, как можно вставить теги в респонс.текст? Мне нужно дополнить список в конце и сделать скриншот нового html
источник

AP

Alex Python in Scrapy
кстати, у меня возникал вопрос, можно ли под селениумом логиниться допустим на сайте, сохранять куки и подсовывать его requests?  чтоб обходить капчу   и прочий шифрогемор при логине
источник

A

Andrii in Scrapy
Alex Python
кстати, у меня возникал вопрос, можно ли под селениумом логиниться допустим на сайте, сохранять куки и подсовывать его requests?  чтоб обходить капчу   и прочий шифрогемор при логине
Можно
источник

A

Andrii in Scrapy
Просто сохрани куки с селениума и подсунь респонсу
источник

A

Andrii in Scrapy
Но думаю сделать логин реквестом проще
источник

AP

Alex Python in Scrapy
😂 так точно капитан )
источник

AP

Alex Python in Scrapy
Andrii
Но думаю сделать логин реквестом проще
сделай ) мне на payeer надо )))
источник

AP

Alex Python in Scrapy
там какая то шифрохрень
источник