Size: a a a

2020 November 10

SA

Sergey Arkhipov in rannts
Если что, w3m незаметно решает больше проблем, чем курл, поскольку и редиректы прозрачно отрабатывает, и куки тоже корректно высылает, так что в общем случае, это хороший совет.

Проблемы начинаются сразу же после общего случая, к сожалению (
источник

SA

Sergey Arkhipov in rannts
источник

SA

Sergey Arkhipov in rannts
источник

SA

Sergey Arkhipov in rannts
Это Variti
источник

SA

Sergey Arkhipov in rannts
источник

SA

Sergey Arkhipov in rannts
Это Kasada
источник

SA

Sergey Arkhipov in rannts
источник

SA

Sergey Arkhipov in rannts
Это Distil + Cloudflare
источник

SA

Sergey Arkhipov in rannts
Ну и так далее по списку. Антиботы 🤷‍♂️
источник

VR

Victor Ryabinin in rannts
w3m -dump https://www.dns-shop.ru/catalog/17aa72ab16404e77/komplektuyushhie-kompyutery-i-noutbuki/ -o user_agent='Mozilla/5.0 (Linux i686; U; w3m 0.5.3; en)'
источник

VR

Victor Ryabinin in rannts
с этим подмена юзер агента не прокатывает
источник

SA

Sergey Arkhipov in rannts
Подмена юзерагента редко где работает. Уже лет 5-10
источник

VR

Victor Ryabinin in rannts
тут прошло
источник

VR

Victor Ryabinin in rannts
тут конечно вообще круть и капчу захотел и клаудфлэр не пускает, чем такое скрапить?
источник

VR

Victor Ryabinin in rannts
только силениумом?
источник

SA

Sergey Arkhipov in rannts
С ним тоже прикольно, потому что есть ряд техник, которые позволяют вычислять headless-браузеры
источник

SA

Sergey Arkhipov in rannts
GitHub - paulirish/headless-cat-n-mouse: Is headless chrome currently detectable? Let's pit the detections and detection evasions against eachother.
https://github.com/paulirish/headless-cat-n-mouse
источник

SA

Sergey Arkhipov in rannts
источник

SA

Sergey Arkhipov in rannts
Ну и вообще весь его блог. Антуан чуть не главный специалист по этой теме
источник

VR

Victor Ryabinin in rannts
Интересно, но на крайний случай всегда есть SikuliX вот ее только если каптчей ловить
источник