Size: a a a

2020 January 17

Т

Технопёс in Scrapy
А ты где ксрф берешь?
источник

M

Maksim in Scrapy
достаю из формы авторизации
источник

M

Maksim in Scrapy
auth_bs = BS(auth_html.content, 'html.parser')

csrf = auth_bs.select('input[name=csrfmiddlewaretoken]')[0]['value']
источник

AR

Andrey Rahmatullin in Scrapy
data верно же для x-www-form-urlencoded
источник

AR

Andrey Rahmatullin in Scrapy
а про хедеры идея верна, непонятно почему не применяется
источник

AR

Andrey Rahmatullin in Scrapy
не знаешь какие - пробуй сначала все похожие на правду
источник

M

Maksim in Scrapy
Их тут довольно много, я хз какие отправлять
источник

B

Bulatbulat48 in Scrapy
Andrey Rahmatullin
data верно же для x-www-form-urlencoded
а да кстати, но тогда нужно Content-Type=application/x-www-form-urlencoded
источник

AR

Andrey Rahmatullin in Scrapy
там ещё и в куке csrftoken
источник

AR

Andrey Rahmatullin in Scrapy
Maksim
Их тут довольно много, я хз какие отправлять
ну берёшь постман и проверяешь, что надо, а что нет
источник

M

Maksim in Scrapy
Это как ?)
Я не шарю
источник

B

Bulatbulat48 in Scrapy
а еще проще берешь из браузера копируешь курл и вставляешь в https://curl.trillworks.com/, описано в faq
источник

AR

Andrey Rahmatullin in Scrapy
Bulatbulat48
а да кстати, но тогда нужно Content-Type=application/x-www-form-urlencoded
не уверен что надо
источник

B

Bulatbulat48 in Scrapy
Andrey Rahmatullin
не уверен что надо
да, действительно есть    "Content-Type": "application/x-www-form-urlencoded",
источник

M

Maksim in Scrapy
Спасибо
источник

M

Maksim in Scrapy
❤️
источник

B

Bulatbulat48 in Scrapy
велкам
источник

iz

izzz zzi in Scrapy
Михаил Синегубов
человеки, сугубо творчески вопрос оптимизации производительноси/памяти.
у меня за проход обрабатывается ~200-400 тыс айтемов (рекорд, пока, ~4 млн)
все пишется в постгрес базу, с контроем уникальности, чанками по 10 тыс. и открытием/закрытием транзакции
какой подход более подходящий для "тру программиста"
1. бросаем все в базу, а там двиг уже сам разберется дубликат или нет (дубликаты игнорятся) - так сейчас и есть
2. держим в памяти список ID (длинное  целое) смотрим дубликаты по нему....
А как быстро он 10к пишет у тебя?)
источник

МС

Михаил Синегубов in Scrapy
Так возник вопрос: насколько обоснованно использовать db фреймворк для скрапи? При условии, что двиг базы жёстко прописан и меняться никогда не будет.
Я всегда считал, что нативный SQL всегда шустрее любого фреймворка...
источник

АП

Агент Печенька in Scrapy
Если sql написан правильно то да.
источник