Size: a a a

2020 July 16

AR

Andrey Rahmatullin in Scrapy
потому что все фигачат в один поток, либо мультипроцессингом
источник

AR

Andrey Rahmatullin in Scrapy
и потому что запускать сразу пачку хромов могут позволить себе далеко не все
источник

t

tfhx8 in Scrapy
Andrey Rahmatullin
потому что все фигачат в один поток, либо мультипроцессингом
мультипроцессингом нормальные сайты с антибот защитой не пропарсишь, поэтому хроме
источник

t

tfhx8 in Scrapy
Andrey Rahmatullin
и потому что запускать сразу пачку хромов могут позволить себе далеко не все
ну несколько шт то должно осилить. Просто вот не понятно как между собой к прмиеру ип адреса синхронизировать или оно само будет уметь?
источник

AR

Andrey Rahmatullin in Scrapy
tfhx8
мультипроцессингом нормальные сайты с антибот защитой не пропарсишь, поэтому хроме
мультипроцессингом с селениумами, алоэ
источник

AR

Andrey Rahmatullin in Scrapy
ну, в большинстве-то случаев вообще сплеша достаточно
источник

AR

Andrey Rahmatullin in Scrapy
tfhx8
ну несколько шт то должно осилить. Просто вот не понятно как между собой к прмиеру ип адреса синхронизировать или оно само будет уметь?
что такое "между собой ип адреса синхронизировать"?
источник

t

tfhx8 in Scrapy
Andrey Rahmatullin
что такое "между собой ип адреса синхронизировать"?
если запускать несколько копий хрома и каждый будет из пула брать ип прокси, то надо сделать так, чтобы оба экземпляра понимали, чтотакой то ип уже использовался и его к примеру надо повторно использовать к примеру через секунд 30
источник

AR

Andrey Rahmatullin in Scrapy
как напишешь кусок про "из пула брать ип прокси", так и будет
источник

t

tfhx8 in Scrapy
Andrey Rahmatullin
ну, в большинстве-то случаев вообще сплеша достаточно
а со сплешем не грузит проц? Просто хз как с ним работать будет с антибот защитой. Там и антикапчу возможно прикрутить?
источник

AR

Andrey Rahmatullin in Scrapy
грузит конечно, как не грузит
источник

AR

Andrey Rahmatullin in Scrapy
зачем антикапче браузер я уже спрашивал
источник

AR

Andrey Rahmatullin in Scrapy
но правда я с таким не работал
источник

t

tfhx8 in Scrapy
Andrey Rahmatullin
как напишешь кусок про "из пула брать ип прокси", так и будет
примеров подобного не находил и не знаю как сделать. Вооще хотел использовать это: https://github.com/TeamHG-Memex/scrapy-rotating-proxies но как оно будет с несколькими копиями работать не знаю
источник

AR

Andrey Rahmatullin in Scrapy
никак не будет, оно не для селениума, а для скрапи
источник

t

tfhx8 in Scrapy
Andrey Rahmatullin
зачем антикапче браузер я уже спрашивал
вообще браузер нужен чтобы js работал. А антикапча работатет если есть js. Ну и ан тибот защиты могут к примеру как то определять браузер. Сплеш просто неизвестный и при проверки может показать бота, этов теории
источник

AR

Andrey Rahmatullin in Scrapy
ну твоё дело
источник

AR

Andrey Rahmatullin in Scrapy
селениум тоже детектится
источник

AR

Andrey Rahmatullin in Scrapy
тебе правда один хрен капчу показывает, поэтому это всё дело такое
источник

t

tfhx8 in Scrapy
Andrey Rahmatullin
никак не будет, оно не для селениума, а для скрапи
тогда я уже хз, нужен ли вообще скрапи, может все с нуля самому писать. Просто ск рапи показался удобным и быстро спайдеры писать
источник