Size: a a a

2020 July 01

К

Кирилл in Scrapy
Oleg Shleiko
Спасибо ещё раз, настроил эти ciphers и всё снова стало парсится
это с яндекс маркетом такие жестяки с ssl? я ещё ни разу не сталкивался с таким
источник

OS

Oleg Shleiko in Scrapy
угу
источник

AR

Andrey Rahmatullin in Scrapy
Oleg Shleiko
Спасибо ещё раз, настроил эти ciphers и всё снова стало парсится
что поставил?
источник

OS

Oleg Shleiko in Scrapy
DOWNLOADER_CLIENT_TLS_CIPHERS = 'SHA1+RSA'
источник

OS

Oleg Shleiko in Scrapy
Кирилл
это с яндекс маркетом такие жестяки с ssl? я ещё ни разу не сталкивался с таким
Это единственное место где и мы сталкнулись 🤣
источник

OS

Oleg Shleiko in Scrapy
Все остальные сайты летят и без извращений
источник

✏d

✏️ Oleksandr dntPani... in Scrapy
у меня код парсера написан извращенцем маньяком.
Было:
s = requests.Session()                          
r1 = s.get('https://m.avito.ru', headers=ph, proxies=ppx, timeout=8)
r2 = s.get('https://m.avito.ru/api/1/items/%s/phone?key=%s' % (itemID, AVITO_KEY))
ХОЧУ ЗАМЕНИТЬ НА:
r2 = scrapy.Request('https://m.avito.ru/api/1/items/%s/phone?key=%s' % (itemID, AVITO_KEY))
верно ли я мыслю?
источник

К

Кирилл in Scrapy
✏️ Oleksandr dntPanix |Worm|
у меня код парсера написан извращенцем маньяком.
Было:
s = requests.Session()                          
r1 = s.get('https://m.avito.ru', headers=ph, proxies=ppx, timeout=8)
r2 = s.get('https://m.avito.ru/api/1/items/%s/phone?key=%s' % (itemID, AVITO_KEY))
ХОЧУ ЗАМЕНИТЬ НА:
r2 = scrapy.Request('https://m.avito.ru/api/1/items/%s/phone?key=%s' % (itemID, AVITO_KEY))
верно ли я мыслю?
скорее всего это была попытка синхронного запроса, если это так, тогда для переделки тебе нужнен scrapy-inline-requests
источник

✏d

✏️ Oleksandr dntPani... in Scrapy
а scrapy.Request чем плох? не уверен, что там надо жесткий синхрон
источник

К

Кирилл in Scrapy
тем что он не синхронный, из того количества инфы что ты дал, такие выводы
источник

К

Кирилл in Scrapy
r2 = scrapy.Request() точно не покатит
источник

МС

Михаил Синегубов... in Scrapy
✏️ Oleksandr dntPanix |Worm|
у меня код парсера написан извращенцем маньяком.
Было:
s = requests.Session()                          
r1 = s.get('https://m.avito.ru', headers=ph, proxies=ppx, timeout=8)
r2 = s.get('https://m.avito.ru/api/1/items/%s/phone?key=%s' % (itemID, AVITO_KEY))
ХОЧУ ЗАМЕНИТЬ НА:
r2 = scrapy.Request('https://m.avito.ru/api/1/items/%s/phone?key=%s' % (itemID, AVITO_KEY))
верно ли я мыслю?
1. 😳 эта срань в коде парсера?
2. он первым запросом куку ловил, не факт что без нее будет работать.

тут либо инлайн реквесты, либо "лесенку" из колбеков делать.

и кстати, я тут открыл для себя разделение куков в скрапи (типа  делить куки на "потоки", не знаю как это назвать по умному), оказалась такая "нямка".... Прям спасла меня
источник

AR

Andrey Rahmatullin in Scrapy
банки это называется
источник

AR

Andrey Rahmatullin in Scrapy
источник

D

Dr. Bot in Scrapy
о спс что напомнил. как раз овсянное есть печенье. пошел за кофе
источник

МС

Михаил Синегубов... in Scrapy
Andrey Rahmatullin
банки это называется
точно, это более правильное определение 😂
источник

✏d

✏️ Oleksandr dntPani... in Scrapy
Кирилл
r2 = scrapy.Request() точно не покатит
оф доки говорят что  и как )
источник

SS

Stepan Smirnov in Scrapy
а как здесь можно построить селектор, чтобы вытащить  "арахис сырой"?
источник

AR

Andrey Rahmatullin in Scrapy
а в чём проблема?
источник

AR

Andrey Rahmatullin in Scrapy
а то //text()[contains(.,"арахис")] формально отвечает на вопрос
источник