Size: a a a

2020 July 23

V

Viktor in Scrapy
Иван Батурин
В смысле читал? Книгу начинал, первого паука сделал, а дальше уже больше гугл и документация. Курс вот только выложили недавно.
Там проектик был vagrant, кто будет делать, делайте через docker.  Я вам сохранил два дня мучений😅
источник

i

ildar in Scrapy
Ilkin Ramazanov
Ребят всем привет. Не могли бы подсказать хорошую книгу видеоролики про scrapy? Желательно на анг но можно и на русском
источник

ИБ

Иван Батурин... in Scrapy
Подскажите,  есть ряд тегов p
<p><strong>caption</strong>
text1
<br>text2</p>
Из них нужно вытащить текст, объединив для каждого его (text1 + text2).
Можно это сделать одним выражением (получить список из объединенных текстовых элементов для каждого тега).
источник

ИБ

Иван Батурин... in Scrapy
response.css("p::text").extract() дает список из всех текстовых элементов всех тэгов без объединения. Текст  в каждом теге произвольный, может состоять из одного или более кусочков.
источник

AR

Andrey Rahmatullin in Scrapy
получаешь список p, достаёшь из каждого текст любым удобным способом
источник

ИБ

Иван Батурин... in Scrapy
Ну так то да. Поискал может есть возможность автоматически сделать join по каждому тэгу. Похоже, что нет.
источник

AR

Andrey Rahmatullin in Scrapy
в скрапи, понятно дело, нет
источник

AR

Andrey Rahmatullin in Scrapy
в xpath может и сможешь написать
источник

AR

Andrey Rahmatullin in Scrapy
но читабельнее будет как я сказал
источник

ИБ

Иван Батурин... in Scrapy
спасибо, сделаю. Тем более, что мне еще и из span надо достать (название характеристики). Хотел их достать двумя списками и for по zip(названия, значения) сделать.... увидел, что иногда сбой получается, так как число элементов разное.
источник
2020 July 24

💀Ҁ

💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲... in Scrapy
ребят, а какая кардинальная разница в:
response.css('title::text').get()
и
response.xpath('//title/text()').get()
?

Как "правильнее"?
источник

V

Viktor in Scrapy
💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲
ребят, а какая кардинальная разница в:
response.css('title::text').get()
и
response.xpath('//title/text()').get()
?

Как "правильнее"?
=
источник

💀Ҁ

💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲... in Scrapy
та я вот вижу, что по функционалу работает одинаково
а вот мож... какой-то из методов шустрее или как..
просто "синтекс" обращения к объекту в DOMе разный
источник

AR

Andrey Rahmatullin in Scrapy
Скорость селекторов обычно неважна
источник

AR

Andrey Rahmatullin in Scrapy
А так разницы нет, юзай какой писать и читать проще, обычно это цсс
источник

💀Ҁ

💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲... in Scrapy
поняв, спасибо
источник

💀Ҁ

💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲... in Scrapy
в xpath я увидел возможность указания простых условий
в css такое есть?
источник

💀Ҁ

💀 Ңӥҟӥҭӓ Ҁӆӑҫҭӥӿӥӊ 🐲... in Scrapy
я чё спрашиваю
планирую писать около десяти парсеров, хочу к какому-то виду одному придерживаться
источник

AR

Andrey Rahmatullin in Scrapy
смотря каких условий
источник

AR

Andrey Rahmatullin in Scrapy
xpath мощнее, css как правило лаконичнее и проще
источник