Size: a a a

2020 May 29

РТ

Ренат Турсунбаев... in Scrapy
да, видел, гугл сервера для вычислений предоставляет
источник

R

Roma in Scrapy
В Дате - дофига возможностей куда расти и развиваться....Тут не только питон нужен - тот же CI /CD
источник

R

Roma in Scrapy
Чуть ли не каждый месяц выкатывают новый фреймворк в области данных от всяких Уберов AirBnb и так далее
источник

РТ

Ренат Турсунбаев... in Scrapy
Roma
В Дате - дофига возможностей куда расти и развиваться....Тут не только питон нужен - тот же CI /CD
это и интересно, как для скраперов делать эту трубу и тесты? есть опыт?
источник

R

Roma in Scrapy
Ну скрапинг - это как бы малая часть - дрочево много с распарсиванием данных, все эти теги и все это на соплях держиться - того гляди завтра все рухнет если источник поменял че то....Хотя строить полноценную платформу по парсингу - интересный кейс
источник

РТ

Ренат Турсунбаев... in Scrapy
верно
источник

R

Roma in Scrapy
Тут смотря какая задача - если ты 1 лям страниц спайдером обходишь и таким спайдеров - 100 -200 - одна задача - попробуйка масштабировать....Если парсишь одну страничку в день - но 100-200  таких - то другая....Зависит от того какая именно задача скрапинга....Тут ребята херачат неделями сайт - тоже интересно как написать такое и еще и конторлировать целостность данных - ибо никто не зочет еще раз неделю скрапить
источник

У

Уруруборос Иванович... in Scrapy
А такой вопрос: насколько трудно найти удалённую работу по скрапингу на постоянную основу?
источник

РТ

Ренат Турсунбаев... in Scrapy
я в прошлые 2 недели написал скраперы 20 сетевых магазинов) но реально геморрой) как это поддерживать - хз)
источник

РТ

Ренат Турсунбаев... in Scrapy
хотелось бы знать внутренности, как они это делают
источник

РТ

Ренат Турсунбаев... in Scrapy
Переслано от Ренат Турсунбаев...
источник

У

Уруруборос Иванович... in Scrapy
И стоит ли вообще курить скрапинг: я перекладывальщик данных и мне скучно - ищю чем можно заняться интересным и заодно какие-нибудь навыки подтянуть (тот же питон).
?
источник

РТ

Ренат Турсунбаев... in Scrapy
Уруруборос Иванович
И стоит ли вообще курить скрапинг: я перекладывальщик данных и мне скучно - ищю чем можно заняться интересным и заодно какие-нибудь навыки подтянуть (тот же питон).
?
ETL процессы ?
источник

У

Уруруборос Иванович... in Scrapy
Ренат Турсунбаев
ETL процессы ?
Да.
источник

У

Уруруборос Иванович... in Scrapy
Етлщик
источник

AR

Andrey Rahmatullin in Scrapy
Ренат Турсунбаев
я в прошлые 2 недели написал скраперы 20 сетевых магазинов) но реально геморрой) как это поддерживать - хз)
какой аспект поддержки интересует?
источник

РТ

Ренат Турсунбаев... in Scrapy
Andrey Rahmatullin
какой аспект поддержки интересует?
написано отдельно проектами скрапи, запускаются в кроне. Как это все отслеживать и идентифицировать пока не решили. Хотим ELK стек поднимать и им как-то смотреть..
источник

AR

Andrey Rahmatullin in Scrapy
обвешать код паука проверками, ошибки выдавать через spidermon в нужный канал (каналы)
источник

EB

Elisei Badanin in Scrapy
Уруруборос Иванович
А такой вопрос: насколько трудно найти удалённую работу по скрапингу на постоянную основу?
очень трудно)
источник

У

Уруруборос Иванович... in Scrapy
Elisei Badanin
очень трудно)
источник