Size: a a a

2021 January 18

AC

A C in Scrapy
Спасибо
источник

AC

A C in Scrapy
Она работает
источник

S

SoHard 🎄 in Scrapy
столько времени потрачено, на создание собственной темы и вопросов в чат вместо того чтобы документацию прочитать
источник

DO

Daniil Okhlopkov in Scrapy
А посоветуйте 3rd party сервис для парсинга линкедина?
Интересует страница с "сотрудниками компании" типа https://www.linkedin.com/company/altinity/people/
источник

T

TENG_TECH in Scrapy
Привет, а есть ли вариант при фолловинге линков в yield запихунуть регулярное выражение?
источник

T

TENG_TECH in Scrapy
def parse_author(self, response):
       def extract_with_css(query):
           time.sleep(5)
           
           return response.css(query).get(default='').strip()
       

       yield {


           'bio':  extract_with_css('p'),
           'email': extract_with_css( regex )


       }
источник

К

Кирилл in Scrapy
TENG_TECH
def parse_author(self, response):
       def extract_with_css(query):
           time.sleep(5)
           
           return response.css(query).get(default='').strip()
       

       yield {


           'bio':  extract_with_css('p'),
           'email': extract_with_css( regex )


       }
источник

AR

Andrey Rahmatullin in Scrapy
ужас какой, time.sleep() в асинхронном приложении
источник

T

TENG_TECH in Scrapy
это там временно
источник

i

i in Scrapy
Alex Python
народ, можно ли как то увеличить  Макс. размер get api запроса больше 2000 символов ? я юзаю requests, или это ограничение никак не изменить ?
это можно сделать если у тебя есть доступ к серверу, на самом сервере. А так - только если он же post-запросы поддерживает. Иначе облом.
источник

i

i in Scrapy
TENG_TECH
Привет, а есть ли вариант при фолловинге линков в yield запихунуть регулярное выражение?
ну ты можешь, но зачем именно в yield, ты можешь формировать в принципе переменную в функции parse_author нормальным образом и так, зачем еще подфункцию специальную для этого создавать, или это не частный случай? И потом, мне кажется, тебе  стоит почитать про item loaders, возможно это то шо надо: https://docs.scrapy.org/en/latest/topics/loaders.html
источник

T

TENG_TECH in Scrapy
i
ну ты можешь, но зачем именно в yield, ты можешь формировать в принципе переменную в функции parse_author нормальным образом и так, зачем еще подфункцию специальную для этого создавать, или это не частный случай? И потом, мне кажется, тебе  стоит почитать про item loaders, возможно это то шо надо: https://docs.scrapy.org/en/latest/topics/loaders.html
я с доки линк фоловер взял, там черз yield было, углубляться сильно не хочется, но наверное переписать линк фоловер все таки стоит
источник

i

i in Scrapy
ты читаешь офисальный тутор по скрапи?
источник

T

TENG_TECH in Scrapy
да
источник

i

i in Scrapy
ээ, нуу, там как-бы вообще не требуется чтобы все запихать в вызов yield
источник

T

TENG_TECH in Scrapy
а вообще да
источник

T

TENG_TECH in Scrapy
только внимание обратил
источник

N

Nazar Tutyn in Scrapy
кто-то встречал ошибку IncompleteRead? Появляется после функции urlopen, когда стараюсь спарсить страницу в BeatifullSoup
источник

S

SoHard 🎄 in Scrapy
Nazar Tutyn
кто-то встречал ошибку IncompleteRead? Появляется после функции urlopen, когда стараюсь спарсить страницу в BeatifullSoup
источник
2021 January 19

М

Максим in Scrapy
Ребят, кто парсил пдф, в какой единице измерения параметры у  LAParams? или вообще есть где-нибудь подробная дока по pdfminer или laparams?
источник