Size: a a a

Compiler Development

2021 May 08

M

MrSmith in Compiler Development
Они называют кроулинг парсингом
источник

DF

Dollar Føølish in Compiler Development
да
источник

M

MrSmith in Compiler Development
Как я понял это что то типа чем я на втором курсе занимался, dom селекторы и пауки на питоне
источник

M

MrSmith in Compiler Development
к парсингу отношения вообше не имеет
источник

M

MaxGraey in Compiler Development
"Почему нужно уметь парсить"

- Изучения и анализ конкурентов
- Помочь другу выиграть в онлайн голосовании WAT???
- Сделать свой пет проджект

Я считаю этот треш нужно удалить хотя бы за это
источник

M

MrSmith in Compiler Development
Да ну не не место этому тут, пусть постит на дижитал, здесь - тупо спам
источник

AK

Andrei Kurosh in Compiler Development
Люто плюсую
источник

AK

Andrei Kurosh in Compiler Development
Написание парсеров для конкретного сайта - это обычно аморальная, иногда даже нелегальгая, и всегда идиотская работа с костылями
источник

卜根 in Compiler Development
это у вас ещё промышленных шпионов к конкурентам не засылали
источник

[

[BRM]White Rabbit in Compiler Development
а у вас засылали?
источник

TS

Timur Safin in Compiler Development
у меня есть вполне легитимный кейс как в Яндекс.Такси парсили сайт дептранса для того чтобы выкачивать текущую базу машин с лицензиями на извоз в Москве и области. Есть конечно открытый датасет с московской лицензией на data.mos.ru, но сайт московской области data.mosreg.ru умер и не собирался оживать, и данные по лицензиями из области нигде кроме парсинга сайта дептранса было не достать.
"Жить захочешь - не так раскорячишься"
(закончил с оффтопом)
источник

卜根 in Compiler Development
была и такая работа
источник

AK

Andrei Kurosh in Compiler Development
не, если у вас есть договоренность с владельцами сайта и они хотят отдать вам данные, но не могут сделать это в более удобном виде (легаси-система, переделывать нет ресурса) - то никаких вопросов нет
источник

AZ

Alexandr Zamaraev in Compiler Development
Вот есть канал о теме парсинга: https://t.me/scrapy_python
Туда всех интересующихся и отправлять.
источник

M

MaxGraey in Compiler Development
+
источник

M

MrSmith in Compiler Development
Это не парсинг же
источник

M

MrSmith in Compiler Development
Снова термины искажают
источник

s

suhr in Compiler Development
Парсинг html регулярками это парсинг.
источник

П

Пух in Compiler Development
источник

AK

Andrei Kurosh in Compiler Development
если прям реально регулярками - то это даже не парсинг, а просто вытаскивание подстрок
источник