Size: a a a

2020 June 12

B

Bulatbulat48 in Scrapy
пару человек точно есть
источник

OS

Oleg Shleiko in Scrapy
А есть у кого мажет материал годный как начать их использовать?
источник

OS

Oleg Shleiko in Scrapy
Я вот тоже задумался подучить и на проекты попробовать вкинуть, да не искал пока ничего, но не факт что будет что-то годное...
источник

К

Кирилл in Scrapy
Если не ощущаешь острой необходимости, тогда не нужно
источник

OS

Oleg Shleiko in Scrapy
Мне кажется что я работу этих инструментов переложил на собственные костыли. У меня пауков запускает супервизор а логи написаны руками и постятся через rabbitmq в elastic search и мониторю я их с помощью кибаны
источник

К

Кирилл in Scrapy
ладно, оно таки тебе нужно..
источник

iz

izzz zzi in Scrapy
Oleg Shleiko
А есть у кого мажет материал годный как начать их использовать?
тут вроде не так давно кто то описывал установку и настройку конфиготов, но особо там не чего сложного нет, пожтому думаю описания из гита должно хватить)
источник

iz

izzz zzi in Scrapy
Boris
# СТАВИМ PIP
sudo apt install python3-pip


# СТАВИМ Scrapyd
pip3 install scrapyd


# ДЕЛАЕМ ИЗ Scrapyd СИСТЕМНЫЙ СЕРВВИС
sudo nano /lib/systemd/system/scrapyd.service
Вставляем следующие строки в файл:

[Unit]
Description=Scrapyd service
After=network.target

[Service]
WorkingDirectory=/etc/scrapyd
ExecStart=/usr/local/bin/scrapyd

[Install]
WantedBy=multi-user.target



# РАЗРЕШАЕМ СЕРВИС Scrapyd
systemctl enable scrapyd.service


# ЗАПУСКАЕМ СЕРВИС Scrapyd
service scrapy start
(если потребуется конфиг для Scrapyd, то его можно записать в файл /etc/scrapyd/scrapyd.conf)


# СТАВИМ Scrapydweb
pip3 install scrapydweb


# ПЕРВЫЙ ЗАПУСК Scrapydweb
mkdir /etc/scrapydweb
cd /etc/scrapydweb
scrapydweb
(после первого запуска в текущей директории создастся файл настроек scrapydweb_settings_v10.py)


# РЕДАКТИРУЕМ НАСТРОЙКИ Scrapydweb
nano scrapydweb_settings_v10.py

SCRAPYDWEB_BIND = '0.0.0.0' <---- сюда вписываем IP вашего VPS
ENABLE_AUTH = True
USERNAME = 'admin'
PASSWORD = 'admin'



# ДЕЛАЕМ ИЗ Scrapydweb СИСТЕМНЫЙ СЕРВВИС
sudo nano /lib/systemd/system/scrapydweb.service
Вставляем следующие строки в файл:

[Unit]
Description=Scrapydweb service
After=network.target

[Service]
WorkingDirectory=/etc/scrapydweb
ExecStart=/usr/local/bin/scrapydweb

[Install]
WantedBy=multi-user.target



# РАЗРЕШАЕМ СЕРВИС Scrapydweb
systemctl enable scrapydweb.service



# ЗАПУСКАЕМ СЕРВИС Scrapydweb
service scrapy start

После проделанных действий scrapydweb должен быть доступен по адресу: <IP вашего VPS>:5000
1
источник

К

Кирилл in Scrapy
разве что 0.0.0.0 можно не менять, и возможно ufw настроить
источник

OS

Oleg Shleiko in Scrapy
Огромнова всем спасибо
источник

К

Кирилл in Scrapy
я думаю если ты осилил супервизор и эластик, то с этим не будет проблем)
источник

A

Alex in Scrapy
всем привет
если кто парсил авито, такой вопрос
у них на сайте в категории пишется скажем 300к обьяв
но на странице 50 обьяв и страниц таких 100
где остальные искать?)
источник

AR

Andrey Rahmatullin in Scrapy
стандартная проблема, на половине сайтов так
источник

AR

Andrey Rahmatullin in Scrapy
крути фильтры и не надейся что соберёшь всё
источник

S

SoHard 🎄 in Scrapy
Alex
всем привет
если кто парсил авито, такой вопрос
у них на сайте в категории пишется скажем 300к обьяв
но на странице 50 обьяв и страниц таких 100
где остальные искать?)
остальные слишком старые/не актуальные. На них никто не зайдёт (ты заходил на 100 страницу гугла?) потому и ограничивают
источник

A

Alex in Scrapy
да я пробую номера телефонов насобирать
актуальность особо не волнует
источник

AR

Andrey Rahmatullin in Scrapy
ну и если есть подкатегории то иди туда, а ещё на авито есть поиск
источник

AR

Andrey Rahmatullin in Scrapy
(что совать в поиск - отдельная творческая задача)
источник

✏d

✏️ Oleksandr dntPani... in Scrapy
Никто не подскажет ссылку на апи cyan.ru
источник

✏d

✏️ Oleksandr dntPani... in Scrapy
актуальный
источник