Size: a a a

2020 December 17

A

Andrii in Scrapy
Паук для фб, а что хоть делать должен?
источник

М

Максим in Scrapy
Andrii
Паук для фб, а что хоть делать должен?
посты в группе (заголовок поста, ссылка, лайки)
источник

AR

Andrey Rahmatullin in Scrapy
graphql
источник

DO

Daniil Okhlopkov in Scrapy
А можно в xpath как-нибудь задать условие:
селектни span, внутри которого есть span, который contains(@class, "asd")?
источник

AR

Andrey Rahmatullin in Scrapy
конечно
источник

AR

Andrey Rahmatullin in Scrapy
"который" переводится как []
источник

DO

Daniil Okhlopkov in Scrapy
Andrey Rahmatullin
"который" переводится как []
О. Спасибо. Не догадался сразу.
источник
2020 December 18

Х

Халил in Scrapy
Привет шаман
источник

S

Shaman89 in Scrapy
источник

S

Shaman89 in Scrapy
Всем привет.  Народ подскажите пришел ли я туда куда стремился или надо искать что-то иное.
источник

AR

Andrey Rahmatullin in Scrapy
откуда нам знать
источник

S

SoHard 🎄 in Scrapy
Shaman89
Всем привет.  Народ подскажите пришел ли я туда куда стремился или надо искать что-то иное.
мне кажется надо искать что-то иное
источник

S

Shaman89 in Scrapy
Понимаю что многое из того что спрошу уже обсасывалось не раз. Сам неделю в гугле живу по всем этим вопросам голова пухнет
источник

AR

Andrey Rahmatullin in Scrapy
давай к делу
источник

S

Shaman89 in Scrapy
В общем стоит задача парсинга поисковой выдачи. От 2 до 10 сайтов разных.  Работа с прокси и в многопотоке(ориентировочно до 4к потоков).
Насколько вообще scrapy подойдет для такого?
Куда лучше сохранять пока из гугла пришел к выводу что в csv а потом в бд. Чтоб не захлебывалась при записи.
Поисковые запросы для урлов так понял лучше через redis пустить?
источник

AR

Andrey Rahmatullin in Scrapy
4к потоков для 2-10 сайтов - бред
источник

AR

Andrey Rahmatullin in Scrapy
но если охота, то скрапи не подойдёт
источник

S

Shaman89 in Scrapy
Andrey Rahmatullin
4к потоков для 2-10 сайтов - бред
Почему бред. Допустим у меня 1кк поисковых запросов и 4 поисковика и в каждом надо по всем ключам сделать парсинг
источник

AR

Andrey Rahmatullin in Scrapy
потому что ботлнеком будет сайт, а для и/о баунд задач 4к потоков не нужны
источник

AR

Andrey Rahmatullin in Scrapy
ну или даже прокси-менеджер будет ботлнеком
источник