Телеграмм чат группы scrapy

бывают такие сайты с которых не возможно спарсить данные?

18:30пожаловаться #1

Alexander Serebrov in Scrapy

В целом, бывают такие с которых почти невозможно спарсить данные из-за антибот защит

18:31пожаловаться #2

Alexander Serebrov in Scrapy

Но скорее всего у тебя просто неправильные селекторы

18:31пожаловаться #3

Alex

всем привет
вопрос:
на одном сайте когда копирую xpath, получаю такого вида код:

//div[@class="col-md-8"]

а на другом вот такой:

/html/body/app-root/div/div[1]/rz-category/div/main/ctg-catalog/div/div[2]/

почему так?

откуда копируешь?

18:35пожаловаться #4

Andrey Rahmatullin

откуда копируешь?

https://rozetka.com.ua/mobile-phones/c80003/
отсюда пробую
что то вообще никак)

18:35пожаловаться #5

я не об этом

18:36пожаловаться #6

что такое "когда копирую xpath", что ты делаешь для этого?

18:36пожаловаться #7

если это в девелопер тулс copy xpath то это изначально неправильно делать

18:37пожаловаться #8

почему оно при этом разное, уже не так важно, так тулза решила, один хрен это в пауке использовать нельзя

18:38пожаловаться #9

Alex

https://rozetka.com.ua/mobile-phones/c80003/
отсюда пробую
что то вообще никак)

а тут ты ещё и JS не отключил

18:38пожаловаться #10

можешь подсказать как отключить и как правильно парсить такого типа сайты?
или может гайд есть

18:40пожаловаться #11

отключить в браузере, проще через расширение

18:40пожаловаться #12

гайды хз

18:41пожаловаться #13

для начала научись писать руками селекторы, которые селектят только то что надо

18:41пожаловаться #14

а можно рабочий пример с такого сайта
что бы хоть увидеть как выглядит

18:46пожаловаться #15

['<span _ngcontent-sc108="" class="goods-dummy__text"></span>']
должен текст быть но его нет) а почему так хз