Size: a a a

2020 June 25

AR

Andrey Rahmatullin in Scrapy
ты и так на питоне пишешь
источник

A

Archie in Scrapy
Andrey Rahmatullin
premature optimization is the root of all evil
тоесть норм?
источник

AR

Andrey Rahmatullin in Scrapy
да
источник

A

Archie in Scrapy
можно в одном пауке 2 отдельних парсинга делать или лучше создать другого паука?
источник

AR

Andrey Rahmatullin in Scrapy
отдельных это как?
источник

МС

Михаил Синегубов... in Scrapy
ну, или можно или нет
вообще, желательно разносить, если надо постоянно пользоваться и поддерживать.
а если один раз спарсить и забыть - пофик
источник

A

Archie in Scrapy
Andrey Rahmatullin
отдельных это как?
ну пропарсил урлы все, поставил в список, сделал новый список на основе рандомных 10 урлов, и теперь надо пропарсить эти 10 урлы
источник

МС

Михаил Синегубов... in Scrapy
Archie
ну пропарсил урлы все, поставил в список, сделал новый список на основе рандомных 10 урлов, и теперь надо пропарсить эти 10 урлы
эээ, нефига не понял, но выглядит как две совершенно разные задачи... :)
источник

A

Archie in Scrapy
всмысле это не связанные парсинги, по очереди будуть выполняться
источник

AR

Andrey Rahmatullin in Scrapy
брр
источник

A

Archie in Scrapy
Михаил Синегубов
эээ, нефига не понял, но выглядит как две совершенно разные задачи... :)
ну 10 рандомных урлов беру которые сграбил с предыдущего парсера, и теперь буду проходить по этим урлам
источник

AR

Andrey Rahmatullin in Scrapy
если код одинаковый, то паук один, если совсем разный то два
источник

МС

Михаил Синегубов... in Scrapy
👆, поддерживаю предыдущего оратора :)
источник

D

Dr. Bot in Scrapy
задача правильная у него. представьте блог. 1) спайдер проходит по всему сайту и собирает ссылки на статьи. 2) второй спайдер проходит уже по списку ссылок на посты и парсит от туда инфу.

итог: делать 2 спайдера нормальная тема. первый можно запускать раз в час для сбора новых ссылок.

второй спайдер работает со список уже спарсенных ссылок
источник

A

Archie in Scrapy
Dr. Bot
задача правильная у него. представьте блог. 1) спайдер проходит по всему сайту и собирает ссылки на статьи. 2) второй спайдер проходит уже по списку ссылок на посты и парсит от туда инфу.

итог: делать 2 спайдера нормальная тема. первый можно запускать раз в час для сбора новых ссылок.

второй спайдер работает со список уже спарсенных ссылок
вот именно)
источник

D

Dr. Bot in Scrapy
Archie
вот именно)
ответ - да. делать 2 спайдера
источник

МС

Михаил Синегубов... in Scrapy
Dr. Bot
задача правильная у него. представьте блог. 1) спайдер проходит по всему сайту и собирает ссылки на статьи. 2) второй спайдер проходит уже по списку ссылок на посты и парсит от туда инфу.

итог: делать 2 спайдера нормальная тема. первый можно запускать раз в час для сбора новых ссылок.

второй спайдер работает со список уже спарсенных ссылок
так и никто против этого ничего и не говорил.
две совершенно разные задачи, оба паука будут с совершенно разной логикой и внутряшками.
Так Андрей и сказал - "если совсем разный - то два" :)

а может у него два раза надо пройти одни и те же ссылки и обработать чуть чуть по разному. Ктож его знает 😏
источник

A

Archie in Scrapy
Dr. Bot
ответ - да. делать 2 спайдера
а как мне теперь во второй спайдер передавать все урлы,  с item или с файла csv где я их сохраняю?
источник

МС

Михаил Синегубов... in Scrapy
Archie
а как мне теперь во второй спайдер передавать все урлы,  с item или с файла csv где я их сохраняю?
с файла, если в файл сохраняешь
как запустить последовательно два паука (если хочешь одним скриптом запускать) - есть на сайте
источник

A

Archie in Scrapy
Михаил Синегубов
с файла, если в файл сохраняешь
как запустить последовательно два паука (если хочешь одним скриптом запускать) - есть на сайте
тоесть мне вот сюда щас данные с csv передавать да?
источник