Size: a a a

2020 July 05

i

ildar in Scrapy
Archie
там же идет подключение к оперативной памяти, такое делают просто когда тестят на етапе разработки же
Ты о чем? Это библиотека чтобы с базами данных примерно как с простым dict работать. И все это с поддержкой транзакций через питоновый with.
источник

i

ildar in Scrapy
А какую к ней базу подключать, посгрес там или sqlite это уже без разницы.
источник

A

Archie in Scrapy
ildar
Ты о чем? Это библиотека чтобы с базами данных примерно как с простым dict работать. И все это с поддержкой транзакций через питоновый with.
я про подключение к ":memory:" чтоб он так не делал
источник

i

ildar in Scrapy
Аа, ну как временное хранилище чего-то что нужно только в процессе, почему бы и нет, скорость то адовая
источник

i

ildar in Scrapy
Хотя пишут что лучше при этом использовать temporary, она де будет и в памяти в основном, и сможет сбрасываться на диск, когда соседнему процессу память понадобится: https://stackoverflow.com/questions/32833145/advantages-of-an-in-memory-database-in-sqlite
источник

SS

Stepan Smirnov in Scrapy
А если один паук отправляет запросы сразу на два сайта (домена), то DOWNLOAD_DELAY для каждого в отдельности соблюдается?
источник

A

Archie in Scrapy
Stepan Smirnov
А если один паук отправляет запросы сразу на два сайта (домена), то DOWNLOAD_DELAY для каждого в отдельности соблюдается?
если download_delay в settings то для всех пауков, а если в конкретной пауке указать то именно для него будет конкретное значение
источник

A

Archie in Scrapy
Stepan Smirnov
А если один паук отправляет запросы сразу на два сайта (домена), то DOWNLOAD_DELAY для каждого в отдельности соблюдается?
тоесть ты для паука определяешь свойство, а не для сайтов, он и там и там будет ползать так само
источник

t

tfhx8 in Scrapy
кто гугл парсит через скрапи?
источник

D

Dmitry in Scrapy
tfhx8
кто гугл парсит через скрапи?
Это весь вопрос?
источник

t

tfhx8 in Scrapy
нет. Может кто знает какой оптимальный таймаут ставить перед запросом и сколько запросов делать в минуту, чтобы капча не вылазила и парсилось все нормально?
источник

D

Dmitry in Scrapy
Будет вылазить все равно - ты реально гугл решил перехитрить?
источник

Юd

Юра de jure in Scrapy
Dmitry
Будет вылазить все равно - ты реально гугл решил перехитрить?
Ну видимо человек уже всю информацию Пентагона спарсил(не хакнул, а именно спарсил) раз за Гугл взялся
источник

t

tfhx8 in Scrapy
Dmitry
Будет вылазить все равно - ты реально гугл решил перехитрить?
так если таймаут будет 30с, оно явно капчу не будет показывать
источник

t

tfhx8 in Scrapy
в общем тут мало кто парсит гугл как я понимаю
источник

Юd

Юра de jure in Scrapy
tfhx8
так если таймаут будет 30с, оно явно капчу не будет показывать
источник

D

Dmitry in Scrapy
tfhx8
так если таймаут будет 30с, оно явно капчу не будет показывать
Будет. И даже если раз в 10 минут парсить - все равно будет, если запросы будут не похожи на человека
источник

Юd

Юра de jure in Scrapy
tfhx8
так если таймаут будет 30с, оно явно капчу не будет показывать
Тайм-аут никак не влияет на появление капчи
источник

D

Dmitry in Scrapy
Юра de jure
Тайм-аут никак не влияет на появление капчи
Дай человеку поупражняться! Где гугл, а где русские парсеры!!
источник

t

tfhx8 in Scrapy
Dmitry
Будет. И даже если раз в 10 минут парсить - все равно будет, если запросы будут не похожи на человека
будут парсить хромом без головы, в скрапи режим такой есть
источник