Size: a a a

2021 January 14

i

i in Scrapy
а, походу вона как этот рыночек работает- там авторизованные edi-поставщики внизу списком, к примеру https://kontur.ru/edi
источник

i

i in Scrapy
из раздела "сетям выгодно свои каталоги кому-то выгружать-отдавать"
источник

i

i in Scrapy
источник

i

i in Scrapy
источник

C

CTRLCTRLV in Scrapy
Andrey Rahmatullin
ну не то чтобы прямо расковырять
первое что приходит на ум скачать apk и засунуть его в эмулятор 😁 а дальше хз как его бодяжить
источник

A

Andrii in Scrapy
Наверное лучше нанять человека
источник

AS

Alexander Serebrov in Scrapy
CTRLCTRLV
первое что приходит на ум скачать apk и засунуть его в эмулятор 😁 а дальше хз как его бодяжить
Можно использовать mitm proxy и перехватывать реквесты от приложения, потом их воспроизводить в скрапи и получать те же данные
Только это не очень правильно с точки зрения нагрузки на их мобильную апи
источник

A

Andrii in Scrapy
А чем HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.FilesystemCacheStorage' лучше за HTTPCACHE_STORAGE = 'scrapy.extensions.httpcache.DbmCacheStorage' ?
источник

AR

Andrey Rahmatullin in Scrapy
тем что дбм говно
источник
2021 January 15

A

Andrii in Scrapy
а если есть уже кеш, можно как-то в елде сказать что для етого запроса не юзать кеш ?
источник

G

Georgiy in Scrapy
Andrii
а если есть уже кеш, можно как-то в елде сказать что для етого запроса не юзать кеш ?
Да, 'dont_cache': True в meta
источник

A

Andrii in Scrapy
Georgiy
Да, 'dont_cache': True в meta
у меня все одно берет с кеша :(
источник

A

Andrii in Scrapy
yield scrapy.FormRequest(url, callback=self.parse_club, body=f"verein_id={club_id}", headers=self.headers, meta={'data': z, 'dont_cache': True})
источник

G

Georgiy in Scrapy
Andrii
у меня все одно берет с кеша :(
это немного не то dont_cache - это что бы не записывать response с запроса в cache
источник

A

Andrii in Scrapy
ну да,а мне нужно что б не брал
источник

G

Georgiy in Scrapy
Andrii
ну да,а мне нужно что б не брал
Вариант 1. - тот cache, которые у тебя накопился к текущему моменту - удалить.
И запустить по новой с yield scrapy.FormRequest(... meta={... 'dont_cache': True})
Тогда новый httpcache уже не будет содежрать response из FormRequests.

Вариант 2. переписать HttpCacheMiddleware.process_request
источник

A

Andrii in Scrapy
Georgiy
Вариант 1. - тот cache, которые у тебя накопился к текущему моменту - удалить.
И запустить по новой с yield scrapy.FormRequest(... meta={... 'dont_cache': True})
Тогда новый httpcache уже не будет содежрать response из FormRequests.

Вариант 2. переписать HttpCacheMiddleware.process_request
да новЬІй впадло запускать) ищу решение
источник

A

Andrii in Scrapy
источник

A

Andrii in Scrapy
что-то такое
источник

G

Georgiy in Scrapy
Там вопрос звучит "how can I prevent that page get into cache?" (как предотвратить попадание страницы в cache), а не как проигнорировать существующий cached response для текущего запроса.
источник