Size: a a a

2020 October 08

AL

Alexey Lemeshevski in Scrapy
оно нормально работает )
источник

AL

Alexey Lemeshevski in Scrapy
ну, скрипты можно вырезать предварительно )
источник

AL

Alexey Lemeshevski in Scrapy
или даже так:
- получить документ
- собрать в lxml в виде объекта
- вырезать скрипты ))
- преобразовать обратно в html
- что-то делать регулярками )
источник

AR

Andrey Rahmatullin in Scrapy
Victor
Мне нужно чтобы сохранялось именно в таком виде <span class="blabla" title="lala"> ибо потом буду делать замены в тексте по этим тэгам. Если делать через регулярку вроде <[^<]*?>
а, т.е. опять XY проблема
источник

AR

Andrey Rahmatullin in Scrapy
ну пока что выглядит что моё решение лучше чем то что ты хотел сделать
источник

V

Victor in Scrapy
Да, похоже без регулярок не обойтись
источник

AR

Andrey Rahmatullin in Scrapy
😁
источник

i

i in Scrapy
Ты бы написал подробней, что в итоге хочешь получить, а то пока это видится, как какой-то неправильный подход к простой задаче.
источник

AR

Andrey Rahmatullin in Scrapy
лол
источник

V

Victor in Scrapy
В общем я его сделал уже, но думал без регулярок можно как то замутить
источник

S

SoHard 🎄 in Scrapy
А что это должно дать?
источник

V

Victor in Scrapy
Весь текст сжимается до <42>
источник

V

Victor in Scrapy
И потом назад его можешь разжать
источник

V

Victor in Scrapy
Используя словарь
источник

К

Кирилл in Scrapy
И зачем это?
источник

S

SoHard 🎄 in Scrapy
Victor
И потом назад его можешь разжать
Для этого есть gzip
источник

S

SoHard 🎄 in Scrapy
Уже всё придумано и без велосипедов
источник

V

Victor in Scrapy
Архиватор Попова слышал?!
источник

V

Victor in Scrapy
Все пакуется в 1 бит
источник

МС

Михаил Синегубов... in Scrapy
🤪, что тут происходит? 🙄
источник