Size: a a a

2020 June 30

AR

Andrey Rahmatullin in Scrapy
🇺🇦 Ad Libitum
Покажите, пожалуйста, простой пример того, как мне вызвать в скрипте дочернюю задачу, что-то я запутался. Например, я собрал со страницы оглавления все ссылки на года. Теперь  я хочу по каждой этой ссылке пройтись и выдернуть ссылки на месяцы. В них - на дни. И потом всё это содрать
источник

i

ildar in Scrapy
if urls там кстати не надо, оно и так не пойдет внутрь если они пустыми будут
источник

АА

Артем Астафьев... in Scrapy
def parse(self, response):
   self.log("title: %s" % response.xpath('//*[@itemprop="name"][1]/text()').extract())
для чего используется метод log()? в документации не нашел об этом, через гугл тоже
источник

К

Кирилл in Scrapy
для того чтоб оставлять сообщение в логе
источник

AR

Andrey Rahmatullin in Scrapy
Артем Астафьев
def parse(self, response):
   self.log("title: %s" % response.xpath('//*[@itemprop="name"][1]/text()').extract())
для чего используется метод log()? в документации не нашел об этом, через гугл тоже
источник

АА

Артем Астафьев... in Scrapy
oh shit
источник

АА

Артем Астафьев... in Scrapy
im sorry
источник

А

Александр in Scrapy
Привет всем!
Кто сталкивался с защитой PerimeterX?
источник

А

Александр in Scrapy
Эта лютая штука конкретно делает мне мозг, если у кого то есть решение, готов хорошо заплатить
источник

А

Александр in Scrapy
Палит на изи селениум, 50/50 палит зеннопостер
источник
2020 July 01

✏d

✏️ Oleksandr dntPani... in Scrapy
нужна помощь, настройка хранилища амазон под скрапи.
вместо амазона сохраняет локально
кто работал с настройками на амазон - и может помочь - буду благодарен.
источник

МС

Михаил Синегубов... in Scrapy
источник

МС

Михаил Синегубов... in Scrapy
оно?
источник

✏d

✏️ Oleksandr dntPani... in Scrapy
наверно, я доки читал, просто наверно не так настроил
источник

✏d

✏️ Oleksandr dntPani... in Scrapy
в стаковерфло настройки отличаются в ряде ответов. Вообще не врубаюсь, ка правильно его настроить.
источник

SS

Stepan Smirnov in Scrapy
вопрос по управлению и поддержке большого количества пауков (тестирование, логирование, вызов пауков по расписанию, уведомления и чтобы можно было скейлить мощности без проблем). Если я правильно понимаю, scrapydweb не позволяет подключать сразу много серверов к процессу. Scrapy Cloud стоит дорого. Какое решение стоит использовать для этой задачи? Что то вроде Scrapy-Cluster?
источник

AR

Andrey Rahmatullin in Scrapy
тестирование, логирование, уведомления это всё вроде отдельно от запуска и расписаний должно быть
источник

SS

Stepan Smirnov in Scrapy
Да, наверное. Интересует именно запуск по расписанию и возможность увеличение мощностей за счет подключения новых серверов на время работы. Ну и чтобы тестирование и уведомления можно было без особых проблем подключить.
источник

i

ildar in Scrapy
Stepan Smirnov
вопрос по управлению и поддержке большого количества пауков (тестирование, логирование, вызов пауков по расписанию, уведомления и чтобы можно было скейлить мощности без проблем). Если я правильно понимаю, scrapydweb не позволяет подключать сразу много серверов к процессу. Scrapy Cloud стоит дорого. Какое решение стоит использовать для этой задачи? Что то вроде Scrapy-Cluster?
Что имеется в виду под невозможностью подключить несколько серверов? Там же прямо в доках пишут Web app for Scrapyd cluster management
источник

i

ildar in Scrapy
источник