Телеграмм чат группы scrapy_python страница 1095

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Scrapy

380 membersпожаловаться на группу

2020 January 22

i

ildar in Scrapy

ну у меня есть парсер - но смысла его линковать нет особого, там уже из сложностей только то, что надо больше полей вытянуть, поэтому он занимает не пол-страницы как в примере, а страницу) Ну еще используется adapt_response - но это стандартная функция и она тоже есть в доках.

источник

17:42пожаловаться #1

i

ildar in Scrapy

хз, может как-то народ чему научился на примерах то и использует, а в примерах обычно всплывает lxml.etree когда про xml речь заходит

источник

17:43пожаловаться #2

AR

Andrey Rahmatullin in Scrapy

Yurii

Почему же советуют совсем иное обычно

потому что это целый спайдер и я не видел юзкейсов для него

источник

17:44пожаловаться #3

i

ildar in Scrapy

ээ, в каком плане "целый спайдер"?

источник

17:46пожаловаться #4

i

ildar in Scrapy

типа pip лишний прописать лень?)

источник

17:47пожаловаться #5

МС

Михаил Синегубов in Scrapy

типа pip лишний прописать лень?)

типа родитель класса другой, не привычный :)
на самом деле, это одна из основных причин. Ну и, не забываем привычку. Я, к примеру, только сейчас про него вспомнил :)

источник

17:48пожаловаться #6

A

Andrii in Scrapy

ну у меня есть парсер - но смысла его линковать нет особого, там уже из сложностей только то, что надо больше полей вытянуть, поэтому он занимает не пол-страницы как в примере, а страницу) Ну еще используется adapt_response - но это стандартная функция и она тоже есть в доках.

а можно скинуть пример, глянуть?)

источник

17:50пожаловаться #7

i

ildar in Scrapy

Еще адски удобно, что иногда в xml не вся инфа, но есть url, и тут легким движением рукивыйти на сайт и допарсить там еще чего не хватает.

источник

17:51пожаловаться #8

AR

Andrey Rahmatullin in Scrapy

типа pip лишний прописать лень?)

какой пип?

источник

17:51пожаловаться #9

i

ildar in Scrapy

pip install scrapy

источник

17:51пожаловаться #10

AR

Andrey Rahmatullin in Scrapy

ааа эээ

источник

17:51пожаловаться #11

i

ildar in Scrapy

короче я видать чего-то не понял)

источник

17:51пожаловаться #12

AR

Andrey Rahmatullin in Scrapy

я видимо не в курсе, о чём была речь в "советуют совсем иное обычно"

источник

17:51пожаловаться #13

i

ildar in Scrapy

Andrii

а можно скинуть пример, глянуть?)

https://docs.scrapy.org/en/latest/topics/spiders.html#xmlfeedspider-example
а тебе этого не хватит?)

источник

17:51пожаловаться #14

AR

Andrey Rahmatullin in Scrapy

я думал речь про парсинге хмля внутри обычного спайдера

источник

17:52пожаловаться #15

AR

Andrey Rahmatullin in Scrapy

https://docs.scrapy.org/en/latest/topics/spiders.html#xmlfeedspider-example
а тебе этого не хватит?)

у него локальные хмлки

источник

17:52пожаловаться #16

i

ildar in Scrapy

так в чем проблема, пишешь file:/// и локальные xml прекрасно открываются, а список их можно получить каким-нибудь import glob и еще одной строчкой

источник

17:52пожаловаться #17

AR

Andrey Rahmatullin in Scrapy

:)))

источник

17:53пожаловаться #18

i

ildar in Scrapy

не, ваще я тоже когда надо было парсить xml, смотрел сначала в сторону xml.etree, все эти блоки обвязок там описанные, потом еще была реализация на BeautifulSoup для другого парсера (тут совет короткий - не пишите обход xml на BS, бхахаха), а потом подумал - блин, может чето в скрапи есть. И та хрень, что занимала 4 страницы, теперь занимает страницу. Профит.

источник

17:58пожаловаться #19

A

Andrii in Scrapy

Еще вопрос: как объединить различные теги в один?

источник

21:46пожаловаться #20