Телеграмм чат группы scrapy

next_page = self.driver.find_element_by_xpath("//button[contains(@class, 'load-more-button')]")
        self.driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
        if next_page:
            next_page.click()
            print('button clicked')
            ???  --- повторить клик
        else:
            print(f'last page reached

источник

19:39пожаловаться #6

М

Мак in Scrapy

лучше наверное аякс запрос найти и повторить

источник

19:49пожаловаться #7

ww

wowa wowa in Scrapy

Всем привет. Может ли мне кто-нибудь помочь?

Я задавал уже несколько вопросов на сайте Стаковерфлов, безответно. Мне хотелось бы парсить етот сайт: https://www.xtip.de/de/fussball/deutschland-bundesliga с помощью scrpay, docker и splash. Но, получаю не <html> а javascript функцию.
Пробовал парсить другие сайты, и у меня удаётся получить их <html>. Но, тем же способом парсить именно етот сайт: https://www.xtip.de/de/fussball/deutschland-bundesliga, мне не удаётся.
Думаю, что Сплеш должен загружать етот сайт, как простой браузер и только потом парсить, когда <html> уже загрузился... Или я ошибаюсь?
Если кто-нибудь сможет мне помочь, буду огромно благодарен!

Здесь мой вопрос на стаковерфлов: https://stackoverflow.com/questions/60646505/i%c2%b4m-getting-javascript-code-instead-of-rendered-html-content-with-scrapy-splash Там мой паук, сеттингс и response

Stack Overflow

I´m getting JavaScript code instead of rendered html content with scrapy-splash

I´m trying to use scrapy-splash to load a javascript based page to get the rendered html content of the page but all I get is javascript code as a response. Why doesn´t my spider execute the javasc...

источник

21:54пожаловаться #8

К

Кирилл in Scrapy

Сплеш не всегда может справиться, попробуй selenium

источник

21:55пожаловаться #9

ww

wowa wowa in Scrapy

мне сказали что селениум медлений. так ли ето?

источник

21:58пожаловаться #10

К

Кирилл in Scrapy

медленее, чем обычные запросы, но иногда нет другого выхода

источник

21:58пожаловаться #11

ww

wowa wowa in Scrapy

дело в том что мне нужно парсить нескольо сайтов за раз в течении нескольких секунд

источник

22:00пожаловаться #12

К

Кирилл in Scrapy

можешь ещё pyppeteer попробовать, он быстрее, но это порт с js

источник

22:01пожаловаться #13

К

Кирилл in Scrapy

wowa wowa

дело в том что мне нужно парсить нескольо сайтов за раз в течении нескольких секунд

От твоего компа зависит, с селениумом это реально

источник

22:01пожаловаться #14

ww

wowa wowa in Scrapy

хорошо спасибо большое

источник

22:05пожаловаться #15

RG

Roman Gangal in Scrapy

wowa wowa

Всем привет. Может ли мне кто-нибудь помочь?

Я задавал уже несколько вопросов на сайте Стаковерфлов, безответно. Мне хотелось бы парсить етот сайт: https://www.xtip.de/de/fussball/deutschland-bundesliga с помощью scrpay, docker и splash. Но, получаю не <html> а javascript функцию.
Пробовал парсить другие сайты, и у меня удаётся получить их <html>. Но, тем же способом парсить именно етот сайт: https://www.xtip.de/de/fussball/deutschland-bundesliga, мне не удаётся.
Думаю, что Сплеш должен загружать етот сайт, как простой браузер и только потом парсить, когда <html> уже загрузился... Или я ошибаюсь?
Если кто-нибудь сможет мне помочь, буду огромно благодарен!

Здесь мой вопрос на стаковерфлов: https://stackoverflow.com/questions/60646505/i%c2%b4m-getting-javascript-code-instead-of-rendered-html-content-with-scrapy-splash Там мой паук, сеттингс и response

Stack Overflow

I´m getting JavaScript code instead of rendered html content with scrapy-splash

I´m trying to use scrapy-splash to load a javascript based page to get the rendered html content of the page but all I get is javascript code as a response. Why doesn´t my spider execute the javasc...

Это SPA. Фронтенд на JS общается с сервером через json. Тебе нужно перехватывать эти запросы и парсить их.

источник

22:14пожаловаться #16

ww

wowa wowa in Scrapy

есть ли гдето объяснение, как ето делается?

источник

22:18пожаловаться #17

RG

Roman Gangal in Scrapy

wowa wowa

есть ли гдето объяснение, как ето делается?

Погугли "снифинг запросов". Если кратко, открываешь в Хроме панель разработчика F12, загружаешь свой сайт и смотришь вкладку "сеть" там есть все запросы с ответами от сервера. Твоя задача их повторить в своем скрепере

источник

22:21пожаловаться #18

ww

wowa wowa in Scrapy

Roman Gangal

Погугли "снифинг запросов". Если кратко, открываешь в Хроме панель разработчика F12, загружаешь свой сайт и смотришь вкладку "сеть" там есть все запросы с ответами от сервера. Твоя задача их повторить в своем скрепере

спасибо тебе, ты меня выручил. Мне осталось найти json ответ где всё нужное находится.

источник

23:17пожаловаться #19

S

Sergey in Scrapy

wowa wowa

спасибо тебе, ты меня выручил. Мне осталось найти json ответ где всё нужное находится.

Чего его искать то , смотри в response

источник

23:40пожаловаться #20