Size: a a a

2021 January 13

МС

Михаил Синегубов... in Scrapy
Михаил
Спасибо, не помогло(
1. закрой терминал (крестик рядом с Local)
2. открой терминал
3. cd product_scraper
4. тут уже пробуй свои извращения
источник

МС

Михаил Синегубов... in Scrapy
̶х̶о̶т̶я̶,̶ ̶с̶т̶о̶п̶,
не, ложная тревога
источник

М

Михаил in Scrapy
Михаил Синегубов
̶х̶о̶т̶я̶,̶ ̶с̶т̶о̶п̶,
не, ложная тревога
Сделал как было сказано
источник

МС

Михаил Синегубов... in Scrapy
😆
оказывается надо войти в папку spiders
я по старой памяти как для crawl писал
источник

К

Кирилл in Scrapy
Михаил
Сделал как было сказано
runspider работает с самим пауком, а не проектом. Поэтому там папка должна быть spiders, или относительный путь к фалу
источник

К

Кирилл in Scrapy
В документации есть список комманд, какие зависят от проекта, а какие нет
источник

МС

Михаил Синегубов... in Scrapy
Кирилл
runspider работает с самим пауком, а не проектом. Поэтому там папка должна быть spiders, или относительный путь к фалу
кстати, тогда, получатеся, он не работает с пайпами, настройками и т.д.?
источник

М

Михаил in Scrapy
Михаил Синегубов
😆
оказывается надо войти в папку spiders
я по старой памяти как для crawl писал
Всем спасибо, заработало) Пока не понятно что, пойду дальше штрудировать))
источник

К

Кирилл in Scrapy
Михаил Синегубов
кстати, тогда, получатеся, он не работает с пайпами, настройками и т.д.?
Выходит что так. Точно не скажу, ниразу не пользовался runspider. Да и остальными командами тоже не пользуюсь, только crawl
источник

AR

Andrey Rahmatullin in Scrapy
runspider для отдельных пауков, он не нужен если уже есть проект
источник

A

Andrii in Scrapy
Михаил
Добрый день, Вообщем начал изучать scrapy по tutorial. И тут началось))

Установил conda, установил скрапи на Windows. Выдает следущую ошибку:

Usage
=====
 scrapy runspider [options] <spider_file>

runspider: error: File not found: scraper.py

Пытаюсь ввести команду scrapy list, так же выдает ошибку.

Scrapy 2.4.1 - no active project

Unknown command: list

Use "scrapy" to see available commands


Я так понимаю ошибка в установке scrapy??? Спасибо
бери другой туториал или сайт, етот тебе не спарсить (у них защита от парсинга)
источник

OS

Oleg Shleiko in Scrapy
Всем здрасте, кто-то ловил такую ошибку?
raise TypeError("quote_from_bytes() expected bytes")
источник

К

Кирилл in Scrapy
Хоть бы полный трейс показал
источник

OS

Oleg Shleiko in Scrapy
сорян
источник

OS

Oleg Shleiko in Scrapy

Traceback (most recent call last):
 File "/usr/local/lib/python3.8/site-packages/twisted/internet/defer.py", line 1418, in _inlineCallbacks
   result = g.send(result)
 File "/usr/local/lib/python3.8/site-packages/scrapy/core/downloader/middleware.py", line 55, in process_response
   response = yield deferred_from_coro(method(request=request, response=response, spider=spider))
 File "/code/yandex_market/middlewares.py", line 99, in process_response
   response = self.solve_captcha(response, request, proxies)
 File "/code/yandex_market/middlewares.py", line 115, in solve_captcha
   key = urllib.parse.quote_plus(response.xpath('//input[@class="form__key"]/@value').get())
 File "/usr/local/lib/python3.8/urllib/parse.py", line 855, in quote_plus
   string = quote(string, safe + space, encoding, errors)
 File "/usr/local/lib/python3.8/urllib/parse.py", line 839, in quote
   return quote_from_bytes(string, safe)
 File "/usr/local/lib/python3.8/urllib/parse.py", line 864, in quote_from_bytes
   raise TypeError("quote_from_bytes() expected bytes")
TypeError: quote_from_bytes() expected bytes
источник

К

Кирилл in Scrapy
Oleg Shleiko

Traceback (most recent call last):
 File "/usr/local/lib/python3.8/site-packages/twisted/internet/defer.py", line 1418, in _inlineCallbacks
   result = g.send(result)
 File "/usr/local/lib/python3.8/site-packages/scrapy/core/downloader/middleware.py", line 55, in process_response
   response = yield deferred_from_coro(method(request=request, response=response, spider=spider))
 File "/code/yandex_market/middlewares.py", line 99, in process_response
   response = self.solve_captcha(response, request, proxies)
 File "/code/yandex_market/middlewares.py", line 115, in solve_captcha
   key = urllib.parse.quote_plus(response.xpath('//input[@class="form__key"]/@value').get())
 File "/usr/local/lib/python3.8/urllib/parse.py", line 855, in quote_plus
   string = quote(string, safe + space, encoding, errors)
 File "/usr/local/lib/python3.8/urllib/parse.py", line 839, in quote
   return quote_from_bytes(string, safe)
 File "/usr/local/lib/python3.8/urllib/parse.py", line 864, in quote_from_bytes
   raise TypeError("quote_from_bytes() expected bytes")
TypeError: quote_from_bytes() expected bytes
Подозреваю, что по этому селектору приходит None, поэтому тип не совпадает. Ну или второй вариант, что там строка, и её нужно закодировать в байты
источник

OS

Oleg Shleiko in Scrapy
Спасибо большое, буду ковырять
источник

М

Михаил in Scrapy
Кто то сталкивался с такой ошибкой? Пытался нагуглить не получилось((

Пишу все согласно доке: https://docs.scrapy.org/en/latest/
источник

М

Михаил in Scrapy
File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\scrapy\robotstxt.py", line 116, in init
   from protego import Protego
builtins.ModuleNotFoundError: No module named 'protego'

2021-01-14 20:36:46 [twisted] CRITICAL:
Traceback (most recent call last):
 File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\twisted\internet\defer.py", line 1418, in _inlineCallbacks
   result = g.send(result)
 File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\scrapy\crawler.py", line 87, in crawl
   self.engine = self._create_engine()
 File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\scrapy\crawler.py", line 101, in _create_engine
   return ExecutionEngine(self, lambda _: self.stop())
 File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\scrapy\core\engine.py", line 69, in init
   self.downloader = downloader_cls(crawler)
 File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\scrapy\core\downloader\__init__.py", line 83, in init
   self.middleware = DownloaderMiddlewareManager.from_crawler(crawler)
 File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\scrapy\middleware.py", line 53, in from_crawler
   return cls.from_settings(crawler.settings, crawler)
 File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\scrapy\middleware.py", line 35, in from_settings
   mw = create_instance(mwcls, settings, crawler)
 File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\scrapy\utils\misc.py", line 167, in create_instance
   instance = objcls.from_crawler(crawler, *args, **kwargs)
 File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\scrapy\downloadermiddlewares\robotstxt.py", line 36, in from_crawler
   return cls(crawler)
 File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\scrapy\downloadermiddlewares\robotstxt.py", line 32, in init
   self._parserimpl.from_crawler(self.crawler, b'')
 File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\scrapy\robotstxt.py", line 124, in from_crawler
   o = cls(robotstxt_body, spider)
 File "C:\Users\PC1\anaconda3\envs\pythonProject\lib\site-packages\scrapy\robotstxt.py", line 116, in init
   from protego import Protego
ModuleNotFoundError: No module named 'protego'
источник

МС

Михаил Синегубов... in Scrapy
самое тупейшее решение, поставить не пробовал?
pip install protego
источник