Size: a a a

2021 January 14

C

CTRLCTRLV in Scrapy
Михаил Синегубов
тебе уже предложили едудил распарсить
так и сделаю сначала
источник

C

CTRLCTRLV in Scrapy
собрать млн позиций с агрегатора для обучения
источник

i

i in Scrapy
ну можно не сидеть вначале. можно нанять человека, чтоб он эти каталоги сам вводил. зависит от того сколько там этих pdf'ок в день надо процессить. я думаю у того же едадила на начальном этапе так и было. тупо дешевле выходило. а потом может они уже и обмазывались нейронками. а скорее всего просто выяснили как-то и по более нормальным каналам начали получать инфо с магазов.
источник

МС

Михаил Синегубов... in Scrapy
i
ну можно не сидеть вначале. можно нанять человека, чтоб он эти каталоги сам вводил. зависит от того сколько там этих pdf'ок в день надо процессить. я думаю у того же едадила на начальном этапе так и было. тупо дешевле выходило. а потом может они уже и обмазывались нейронками. а скорее всего просто выяснили как-то и по более нормальным каналам начали получать инфо с магазов.
я ставлю на последний пункт :)
источник

S

SoHard 🎄 in Scrapy
Магазину выгодно чтобы его акции публиковались
источник

C

CTRLCTRLV in Scrapy
i
ну можно не сидеть вначале. можно нанять человека, чтоб он эти каталоги сам вводил. зависит от того сколько там этих pdf'ок в день надо процессить. я думаю у того же едадила на начальном этапе так и было. тупо дешевле выходило. а потом может они уже и обмазывались нейронками. а скорее всего просто выяснили как-то и по более нормальным каналам начали получать инфо с магазов.
да, можно так, но никто не отменял банкротства ритейлеров и досвиданья  канал.
источник

S

SoHard 🎄 in Scrapy
Потому в больших должно апи быть для этого
источник

i

i in Scrapy
причем я не удивлюсь, если этим "нормальным" каналом было написание тупо парсера всего магаза, для отдельных магазов, лол)
источник

i

i in Scrapy
чтоб он там выискивал перечеркнутые цены
источник

МС

Михаил Синегубов... in Scrapy
CTRLCTRLV
да, можно так, но никто не отменял банкротства ритейлеров и досвиданья  канал.
т.е., если карусель (точнее, так называемый "х5") обанкротится и магазины закроются - тебе все еще нужны будут данные?
источник

i

i in Scrapy
все-лучше чем над pdf на 200 или сколько там dpi OCR проводить.
источник

C

CTRLCTRLV in Scrapy
Михаил Синегубов
т.е., если карусель (точнее, так называемый "х5") обанкротится и магазины закроются - тебе все еще нужны будут данные?
данные всегда нужны. допустим х5 нагнется, откроются другие ритейлеры
источник

МС

Михаил Синегубов... in Scrapy
CTRLCTRLV
данные всегда нужны. допустим х5 нагнется, откроются другие ритейлеры
хуже будет если у них придет новый директор маркетинга - любовница ген. дира. Ибо тогда будет "п...ц нейронке, ибо они опять поменяли дизайн" 😂
источник

МС

Михаил Синегубов... in Scrapy
не знаю, для таких случаев, по моему, лучше именно прямой контакт. Тем более, магазу это стоит только в отправку данных. А текст, даже в той же экселке - намного легче в обработке
источник

C

CTRLCTRLV in Scrapy
было бы все так просто, не парсил бы ручками пдф
источник

МС

Михаил Синегубов... in Scrapy
про едудил уже, наверное. моветон напомнить?
сначае ее, потом уже думай что дальше будет. Будет имя - легче пойдут на контакт
источник

МС

Михаил Синегубов... in Scrapy
а так, понятно, что с "Васей Пупкиным из деревни Гадюкино" никто говорить не будет
источник

AR

Andrey Rahmatullin in Scrapy
i
причем я не удивлюсь, если этим "нормальным" каналом было написание тупо парсера всего магаза, для отдельных магазов, лол)
не у всех есть вообще полный каталог на сайте ж
источник

AR

Andrey Rahmatullin in Scrapy
вообще я сразу подумал что им апи выдали
источник

C

CTRLCTRLV in Scrapy
и в правду java какой то с++ный
источник