Ну скрапинг - это как бы малая часть - дрочево много с распарсиванием данных, все эти теги и все это на соплях держиться - того гляди завтра все рухнет если источник поменял че то....Хотя строить полноценную платформу по парсингу - интересный кейс
Тут смотря какая задача - если ты 1 лям страниц спайдером обходишь и таким спайдеров - 100 -200 - одна задача - попробуйка масштабировать....Если парсишь одну страничку в день - но 100-200 таких - то другая....Зависит от того какая именно задача скрапинга....Тут ребята херачат неделями сайт - тоже интересно как написать такое и еще и конторлировать целостность данных - ибо никто не зочет еще раз неделю скрапить
И стоит ли вообще курить скрапинг: я перекладывальщик данных и мне скучно - ищю чем можно заняться интересным и заодно какие-нибудь навыки подтянуть (тот же питон). ?
И стоит ли вообще курить скрапинг: я перекладывальщик данных и мне скучно - ищю чем можно заняться интересным и заодно какие-нибудь навыки подтянуть (тот же питон). ?
написано отдельно проектами скрапи, запускаются в кроне. Как это все отслеживать и идентифицировать пока не решили. Хотим ELK стек поднимать и им как-то смотреть..