Size: a a a

2020 June 24

AR

Andrey Rahmatullin in Scrapy
Твистед последний?
источник

D

Dmitry in Scrapy
Andrey Rahmatullin
Твистед последний?
Ну месячной давности макс
источник

D

Dmitry in Scrapy
Ок, скину. А как это обозвать лучше?
источник

D

Dmitry in Scrapy
Leaking exception? :)
источник

AR

Andrey Rahmatullin in Scrapy
Наверно
источник

AR

Andrey Rahmatullin in Scrapy
Напиши только что это бранч
источник

SS

Stepan Smirnov in Scrapy
а что такое memory leak в контексте парсинга?
источник

AR

Andrey Rahmatullin in Scrapy
контекст не важен, это везде одно и то же означает
источник

i

ildar in Scrapy
Vladyslav Babych
Был у кого-то опыт миграции с parsel на selectolax? Можно это как-то провернуть без переписывания всех селекторов и процессоров?
а куда мигрируешь?
источник

VB

Vladyslav Babych in Scrapy
ildar
а куда мигрируешь?
На selectolax
источник

i

ildar in Scrapy
в первый раз слышу. может мне тоже надо) а чем он круче?
источник

VB

Vladyslav Babych in Scrapy
ildar
в первый раз слышу. может мне тоже надо) а чем он круче?
Значительно быстрее
источник

VB

Vladyslav Babych in Scrapy
Но нету плюшек типа ::text
источник

VB

Vladyslav Babych in Scrapy
И есть nth child
источник

VB

Vladyslav Babych in Scrapy
источник

i

ildar in Scrapy
аа, скорость)  я вот как-то нашел вместо json тоже orjson, где надо лопатить много json быстрее получается.
источник

i

ildar in Scrapy
а ты проверял на своем каком-то проекте? ну просто, скрапи может молотить там 2-4к айтемов на 10-20 полей в секунду. И обычно все упирается в сеть
источник

VB

Vladyslav Babych in Scrapy
ildar
а ты проверял на своем каком-то проекте? ну просто, скрапи может молотить там 2-4к айтемов на 10-20 полей в секунду. И обычно все упирается в сеть
Да, тестил на своих данных. У меня около 50 селекторов, я добавил лог на скорость обработки, и их парсинг до 0.5 секунд занимает
источник

VB

Vladyslav Babych in Scrapy
Вот сейчас наверное придется переписывать обработчики и теги
источник

i

ildar in Scrapy
а так, про миграцию, ты по-идее можешь реализовать наверное этот ::text, может быть даже тупо стырить его с parsel, или где-то в области работы с lxml подсунуть ему этот селехтолах
источник