Size: a a a

2021 February 10

A

Andrii in Scrapy
Shaman89
Это ж не соцсеть тебе точнее чем страна не поставишь
Геолокация нет? В апи можно
источник

S

Shaman89 in Scrapy
В настройках там можно поставить страну язык и регион(но не для каждой страны) но особой разницы не увидел в выдаче. Но я не логинился
источник

DO

Daniil Okhlopkov in Scrapy
Boris Litvyakov
вроде бы в bs4 есть подобные функции типа выгрузи мне все таблицы, думаю его за это и любят в широких массах, только на деле чуток нестандартная таблица или запрос на выгрузку и все ломается, поэтому лучше освоить универсальный инструмент и все

еще в requests-html видел подобные надстройки как ты говоришь типа все ссылки итд
Опять видимо я не умею выражать свои мысли. Попробую так:

Я хочу по любой ссылке получить словарик ее свойств, которые могут быть интересны. и это не только ссылки: метатеги, телефоны, почты, IP, скорость загрузки страницы. Перечислять можно много.
источник

S

Shaman89 in Scrapy
Daniil Okhlopkov
Опять видимо я не умею выражать свои мысли. Попробую так:

Я хочу по любой ссылке получить словарик ее свойств, которые могут быть интересны. и это не только ссылки: метатеги, телефоны, почты, IP, скорость загрузки страницы. Перечислять можно много.
Откуда либа знает что тебе надо а что нет. Одному юзеру нужны все ссылки. Второму все картинки. Третьему только тайтлы. Выше правильно сказали для этого есть xpath. А либа лишь должна уметь с ним работать
источник

DO

Daniil Okhlopkov in Scrapy
Shaman89
Откуда либа знает что тебе надо а что нет. Одному юзеру нужны все ссылки. Второму все картинки. Третьему только тайтлы. Выше правильно сказали для этого есть xpath. А либа лишь должна уметь с ним работать
Либа может вернуть вообще все) Я не думаю, что список фичей бесконечен.
источник

DO

Daniil Okhlopkov in Scrapy
Я вижу в этом ценность anyway. Понял, что вас переубеждать мне нет смысла
источник

BL

Boris Litvyakov in Scrapy
Daniil Okhlopkov
Я вижу в этом ценность anyway. Понял, что вас переубеждать мне нет смысла
в чем переубеждать? я же написал что в bs4 есть ценность, только когда много парсишь этот подход перестает работать и лучше овладеть xpath и навсегда забыть об этих поделках, они становятся не нужны
источник

МС

Михаил Синегубов... in Scrapy
От вы развели болталку😄.
Человек спросил, ему ответили "готового не видели", он сказал "ну, ок"
При чем тут xpath, bsи еже с ними? Это с помощью чего это можно сделать, но не то, что человеку нужно
источник

AR

Andrey Rahmatullin in Scrapy
вот да
источник

IF

I am Focused in Scrapy
Hello thank you for the software and community. Glad to be apart 👋
источник

DO

Daniil Okhlopkov in Scrapy
Михаил Синегубов
От вы развели болталку😄.
Человек спросил, ему ответили "готового не видели", он сказал "ну, ок"
При чем тут xpath, bsи еже с ними? Это с помощью чего это можно сделать, но не то, что человеку нужно
❤️
источник

МС

Михаил Синегубов... in Scrapy
Но но, по аккуратнее тут🙈
источник

i

i in Scrapy
Daniil Okhlopkov
Опять видимо я не умею выражать свои мысли. Попробую так:

Я хочу по любой ссылке получить словарик ее свойств, которые могут быть интересны. и это не только ссылки: метатеги, телефоны, почты, IP, скорость загрузки страницы. Перечислять можно много.
В глобальном плане-можешь копать в сторону ML, с нейросеточками. Но это такой профит, что вряд ли будет лежать полностью готовое в открытом доступе, надо будет собирать из запчастей. Там еще у тебя проблема встанет определять по координатам на странице (полученный условный ocr+нейросеть на что ты там её натренируешь,чтоб она тебе выбирала полезностей) координаты того куска в html, который это рендерит. И тут же рядом ещё js- рендер. А вообще, ты всё ещё слишком общий вопрос задаешь, половину штук можно померить условными тестирующими средствами (см к примеру в сторону lighthouse), половина-километры if'ов.

P.S. а вообще, у меня возникает подозрение, что эти вопросики-тупо скрытая реклама своего телеграм-канала.
источник

NS

Nikolay Semenov in Scrapy
Нужно сделать парсинг. Но перед этим нужно сделать запрос
источник

NS

Nikolay Semenov in Scrapy
Как сделать запрос?
источник

К

Кирилл in Scrapy
Nikolay Semenov
Как сделать запрос?
В документации есть примеры запросов
источник

BB

Bral Bral in Scrapy
Добрый вечер, имеется проблема - Enabled item pipelines постоянно пустое. Запускаю через скрипт, исепользуя CrawlerProcess. Передаю в конструктор  "ITEMS_PIPELINES": {'pipeline': 200}, Вообще что нужно писать , если сама структура проекта не определена , а пайплайн определен в этом же файле.
источник

AR

Andrey Rahmatullin in Scrapy
передавать класс вместо имени
источник

AR

Andrey Rahmatullin in Scrapy
если версия старая то правильно писать имя, можно в тестах посмотреть (от этой же старой версии)
источник

BB

Bral Bral in Scrapy
Andrey Rahmatullin
передавать класс вместо имени
Благодарю  за ответ. пытался, как Вы сказали, раньше, но безрезультатно. Да даже стандартный scrapy.pipelines.files.FilesPipeline не определяется.
источник