Size: a a a

2020 December 09

К

Кирилл in Scrapy
Selector(text=data['html'])
источник

A

AstralRomance in Scrapy
Кирилл
Selector(text=data['html'])
spasibo
источник

AR

Andrey Rahmatullin in Scrapy
жжоте
источник

AR

Andrey Rahmatullin in Scrapy
AstralRomance
callback=jQuery33107852307445550264_1607531304657&_=1607531304658

Вот этот - точно.
это просит эту обёртку положить в ответ
источник

AR

Andrey Rahmatullin in Scrapy
jsonp
источник

К

Кирилл in Scrapy
какая-то лажа с этим text и Selector, все новички постоянно натыкаются на эту ошибку
источник
2020 December 10

A

Andrii in Scrapy
Tripadvisor без проблем скрапится?
источник

AR

Andrey Rahmatullin in Scrapy
Да
источник

A

Andrii in Scrapy
Как очистить кукис после колбека? Проблема такая - решаю капчу, делаю колбек и там проверяю правильно ли капчу написали. Если нет делаю колбек назад, но нужно очистить кукис. Делаю meta={'dont_merge_cookies': True}, но походу не роботает, потому что после етого ни разу правильное решение не пришло
источник

AR

Andrey Rahmatullin in Scrapy
meta={'dont_merge_cookies': True} не очищает, оно делает игнор для этого реквеста
источник

AR

Andrey Rahmatullin in Scrapy
очистить мне кажется нормально нельзя
источник

G

Georgiy in Scrapy
Andrii
Как очистить кукис после колбека? Проблема такая - решаю капчу, делаю колбек и там проверяю правильно ли капчу написали. Если нет делаю колбек назад, но нужно очистить кукис. Делаю meta={'dont_merge_cookies': True}, но походу не роботает, потому что после етого ни разу правильное решение не пришло
Можно на ходу создать/использовать новый объект cookiejar используя
cookiejar meta key
https://docs.scrapy.org/en/2.4/topics/downloader-middleware.html#multiple-cookie-sessions-per-spider
источник

AR

Andrey Rahmatullin in Scrapy
вариант
источник

МС

Михаил Синегубов... in Scrapy
Georgiy
Можно на ходу создать/использовать новый объект cookiejar используя
cookiejar meta key
https://docs.scrapy.org/en/2.4/topics/downloader-middleware.html#multiple-cookie-sessions-per-spider
угу, только потом менеждить куки или сессии надо, точно не помню что именно.
источник

AR

Andrey Rahmatullin in Scrapy
ну это его теперь везде таскать
источник

G

Georgiy in Scrapy
Михаил Синегубов
угу, только потом менеждить куки или сессии надо, точно не помню что именно.
Тогда оставшийся вариант: с использованием
crawler.engine.downloader.middleware.middlewares... вытянуть обьект CookiesMiddleware и напрямую очистить cookiejar
источник
2020 December 11

B

Balloon Fighter 🎈 in Scrapy
Помогите пожалуйста! У меня очень странная ошибка. При запуске приведенного кода данные собираются, но начинают встречаться дубли. Не на каждый собранный элемент, а примерно 1 из 10 адресов. Если закомментировать настройки DUPEFILTER_CLASS, то данные собираются корректно, но в несколько раз меньше записей получается. https://github.com/p37rov-nvkz/mingkh/blob/master/mingkh/mingkh/spiders/spider.py
источник

МС

Михаил Синегубов... in Scrapy
```class BaseDupeFilter:

   @classmethod
   def from_settings(cls, settings):
       return cls()

   def request_seen(self, request):
       return False

   def open(self):  # can return deferred
       pass

   def close(self, reason):  # can return a deferred
       pass

   def log(self, request, spider):  # log that a request has been filtered
       pass````

а он разве должен что то фильтровать?🧐
источник

AR

Andrey Rahmatullin in Scrapy
в этом и прикол
источник

AR

Andrey Rahmatullin in Scrapy
если фильтровать дупы, то дупы фильтруются, а если нет  то нет
источник