Size: a a a

2020 July 21

AR

Andrey Rahmatullin in Scrapy
нормальных бесплатных не бывает
источник

TK

Tatiana Kondratevich in Scrapy
Мне пока нужно для теста что это вообще поможет. А потом для продакшена уже можно будет платные подобрать.
источник

МТ

Максим Татаринов... in Scrapy
Tatiana Kondratevich
Привет, подскажите пожалуйста где можно найти прокси нормальные?Пытаюсь парсить https://www.paniniamerica.net/, а он блочит.
источник

TK

Tatiana Kondratevich in Scrapy
спасибо, попробую
источник

МТ

Максим Татаринов... in Scrapy
Гуглится по первым строкам запроса. Это один из таких сервисов, которых достаточно много. За бесплатно будет время уходить на перебор, так как их быстро банят, но для тестов сгодится
источник

К

Кирилл in Scrapy
Бесплатные даже для тестов не годятся
источник

TK

Tatiana Kondratevich in Scrapy
Кирилл
Бесплатные даже для тестов не годятся
все так плохо?
источник

К

Кирилл in Scrapy
Конечно
источник

МС

Михаил Синегубов... in Scrapy
Tatiana Kondratevich
все так плохо?
на самом деле, все намного хуже :).
если взять 15-20 тысяч бесплатных "анонимных" из них будет ~300 живых и действительно анонимных. А вот элиток (которые не палятся, что они прокси), так вообще единицы.
Прибавь сюда дичайше медленную скорость и очень  низкий аптайм - и получишь "бесплатные прокси"
источник

i

ildar in Scrapy
Семён Трояновский
вообще твой запрос явно звучит как кейс для очереди. т.ч. имхо скорее наоборот - все кроме очереди будет костылем
у меня частенько бывает, что то, что начинается как "дану, технология Х для этой штуки это уж больно оверкилл" заканчивается тем, что половину штук в итоге реализуешь велосипедом и в итоге приходишь к тому, что проще было сразу взять ее)
источник

i

ildar in Scrapy
Именно для тестов можно взять windscribe, там трафик на месяц 5 гигов где-то, можно всякими промокодами  "раскачать" до 30-50. Обычно он хорошо пашет на той же америке.
источник

t

tfhx8 in Scrapy
кто нибудь находил benchmark splash vs chrome headless?
источник

A

Andrii in Scrapy
+ пупетр)
источник

t

tfhx8 in Scrapy
пупетр же вроде тормознутее схроме
источник

t

tfhx8 in Scrapy
Просто есть такая прога как а парсер. Она там гугл может парсить в сотни потоков, сомневаюсь что у них там все через браузер крутится, но что внутри хз
источник

JW

John Wayne in Scrapy
скажите как правильно дебажить паука в контейнере в vscode? есть docker compose 2 контейнера, один postgres server другой scrapyd+scrapydweb и сам scrapy проект, если в паука добавить debugpy
debugpy.listen(('0.0.0.0', 5678))
debugpy.wait_for_client()
мне нужно присоедениться к командной строке контейнера, запустить паука, и только тогда f5 работает, но и тут проблемы...есть способ сделать это более правильно?
conf vscode
{
           "name": "Python: Remote Attach",
           "type": "python",
           "request": "attach",
           "port": 5678,
           "host": "localhost",
           "pathMappings": [
             {
               "localRoot": "${workspaceFolder}",
               "remoteRoot": "/usr/src/app"
             }
           ]
         },
источник

S

SoHard 🎄 in Scrapy
куда можно недорого захостить парсер ?
источник

S

SoHard 🎄 in Scrapy
нужен на один раз грубо говоря
источник

МП

Максим Петров... in Scrapy
aws ec2
источник

SS

Stepan Smirnov in Scrapy
SoHard 🎄
куда можно недорого захостить парсер ?
минимальный сервер стоит 3-5$/месяц. Но его настраивать надо.
Есть Scrapy Cloud, вроде даже с бесплатным доступом.
источник