Size: a a a

2020 July 03

SS

Stepan Smirnov in Scrapy
а каким образом можно посчитать количество ссылок в sitemap?
источник

🎱

🎱 in Scrapy
Stepan Smirnov
Вопром не совсем по теме, но: как извлекать информацию из pdf файлов, которые имеют практически одинаковый вид? Самих файлов около 10k.
pdftotext глянь либу
источник
2020 July 04

AR

Andrey Rahmatullin in Scrapy
Stepan Smirnov
а каким образом можно посчитать количество ссылок в sitemap?
в скрапи?
источник

SS

Stepan Smirnov in Scrapy
да, желательно
источник

A

Archie in Scrapy
ктонить юзал скрапи с джанго, все ок пашет?
источник

К

Кирилл in Scrapy
Archie
ктонить юзал скрапи с джанго, все ок пашет?
Если все правильно сделаешь, будет ок
источник

AD

Arigato Darigato in Scrapy
Подскажите, пожалуйста, как мне установить Scrapy? Пишет ошибка при установке Twisted
https://pastebin.com/dePwmieh
источник

AD

Arigato Darigato in Scrapy
Установил последние Build tools
источник

AD

Arigato Darigato in Scrapy
Windows 7
источник

AR

Andrey Rahmatullin in Scrapy
Официальная рекомендация по-прежнему в том чтобы так не делать, а взять конду
источник

🇺L

🇺🇦 Ad Libitum in Scrapy
добрый день
источник

🇺L

🇺🇦 Ad Libitum in Scrapy
а почему print('*** START parse_months: ' + url) не хочет работать? onlyl concatencate str (not Selector) означает то, что я внутри цикла не могу print для url делать?
источник

🇺L

🇺🇦 Ad Libitum in Scrapy
Извините, я только шишки набиваю ещё. )
источник

🇺L

🇺🇦 Ad Libitum in Scrapy
Поменял на всякий пожарный кавычки на двойные, посмотрел ещё раз примеры, попинал по колёсам, лобовуху протёр, все равно остаётся неясным.
def parse_months(self, response):
   # urls = response.css('a.series-catalog-block')
   urls = response.xpath("//div[@class='j-calendar-month']/a/@href")
   if urls:
       for url in urls:
           print("*** START parse_months: "+url)
           yield response.follow(url, callback=self.parse_dates)

Ясно, что это не str, но тогда как его вызывать, url[0]? url[1]?
источник

🇺L

🇺🇦 Ad Libitum in Scrapy
Попробовал, тоже не прокатывает. В примере указано response.var но у меня же она внутри цикла
источник

S

SoHard 🎄 in Scrapy
🇺🇦 Ad Libitum
а почему print('*** START parse_months: ' + url) не хочет работать? onlyl concatencate str (not Selector) означает то, что я внутри цикла не могу print для url делать?
Там же написано
источник

S

SoHard 🎄 in Scrapy
Ты строку с селектором скрещиваешь
источник

i

ildar in Scrapy
🇺🇦 Ad Libitum
а почему print('*** START parse_months: ' + url) не хочет работать? onlyl concatencate str (not Selector) означает то, что я внутри цикла не могу print для url делать?
забыл небось get() написать
источник

i

ildar in Scrapy
🇺🇦 Ad Libitum
Поменял на всякий пожарный кавычки на двойные, посмотрел ещё раз примеры, попинал по колёсам, лобовуху протёр, все равно остаётся неясным.
def parse_months(self, response):
   # urls = response.css('a.series-catalog-block')
   urls = response.xpath("//div[@class='j-calendar-month']/a/@href")
   if urls:
       for url in urls:
           print("*** START parse_months: "+url)
           yield response.follow(url, callback=self.parse_dates)

Ясно, что это не str, но тогда как его вызывать, url[0]? url[1]?
и я снова повторяю - if urls тут не нужен)
источник

A

Andrii in Scrapy
🇺🇦 Ad Libitum
Поменял на всякий пожарный кавычки на двойные, посмотрел ещё раз примеры, попинал по колёсам, лобовуху протёр, все равно остаётся неясным.
def parse_months(self, response):
   # urls = response.css('a.series-catalog-block')
   urls = response.xpath("//div[@class='j-calendar-month']/a/@href")
   if urls:
       for url in urls:
           print("*** START parse_months: "+url)
           yield response.follow(url, callback=self.parse_dates)

Ясно, что это не str, но тогда как его вызывать, url[0]? url[1]?
urls = response.xpath("//div[@class='j-calendar-month']/a/@href").get()
источник