Size: a a a

2021 January 14

A

Andrii in Scrapy
Dmitry
думал, что как-то внутри это должно быть реализовано или кто-то реализовал уже, но гугл не помог. остается только "руками"
Смердж в новом и вставь, не пойдет?
источник

C

CTRLCTRLV in Scrapy
Привет. Просветите новичка насчет что лучше в парсинге java или python?
источник

МС

Михаил Синегубов... in Scrapy
CTRLCTRLV
Привет. Просветите новичка насчет что лучше в парсинге java или python?
то, что больше знаешь
источник

C

CTRLCTRLV in Scrapy
предположу тот и тот справляется быстрее?
источник

AR

Andrey Rahmatullin in Scrapy
быстрее чем что?
источник

C

CTRLCTRLV in Scrapy
Andrey Rahmatullin
быстрее чем что?
если сравнивать производительность при парсинге  java и python
источник

AR

Andrey Rahmatullin in Scrapy
то?
источник

AR

Andrey Rahmatullin in Scrapy
ну и надо уточнять задачу
источник

C

CTRLCTRLV in Scrapy
да банально распарсить код разметки в 1к строк
источник

i

i in Scrapy
CTRLCTRLV
Привет. Просветите новичка насчет что лучше в парсинге java или python?
скажем так, когда-то давно я писал парсер на java. кода вышло в 2 раза больше, чем даже в тупой связке bs+requests, не говоря уж о скрапи
источник

i

i in Scrapy
про производительность на 1к строках можно не задумываться. там будут доли секунды без учета сетевых задержек.
источник

AR

Andrey Rahmatullin in Scrapy
CTRLCTRLV
да банально распарсить код разметки в 1к строк
это мгновенно где угодно
источник

S

SoHard 🎄 in Scrapy
CTRLCTRLV
если сравнивать производительность при парсинге  java и python
обычно проблема не в скорости языка, а в скорости сети
источник

A

Andrii in Scrapy
SoHard 🎄
обычно проблема не в скорости языка, а в скорости сети
Скорости обекта между монитором и стулчиком
источник

C

CTRLCTRLV in Scrapy
копипаст с пдфки нетекстового меня в общем насилует.
хочется просто сказать иди на сайт, скопируй с пдфки все товары и занеси в базу
источник

S

SoHard 🎄 in Scrapy
Andrii
Скорости обекта между монитором и стулчиком
не всегда, недавно был сайт который по 30 сек отдавал страницу
источник

A

Andrii in Scrapy
SoHard 🎄
не всегда, недавно был сайт который по 30 сек отдавал страницу
Уххх жесть :)
источник

i

i in Scrapy
про яву надо обычно задумываться, когда у тебя несколько терабайт данных и там страшные штуки звучат рядом типа kafka, lucene и диспетчер диспетчера диспетчерит интерфейс за интерфейсом.
источник

i

i in Scrapy
не когда 1к строк.
источник

i

i in Scrapy
тем более в пдф, тем более в нетекстовом пдф
источник