Size: a a a

2020 April 21

M

Max in Scrapy
переходишь по ссылке и спосле редиректа собираешь response.url
источник

К

Кирилл in Scrapy
В request.meta.get('redirect_urls')
источник

O

Orekhov Web Dev. in Scrapy
не особо понимаю
источник

O

Orekhov Web Dev. in Scrapy
там 500 ссылок, как мне это сделать...
источник

К

Кирилл in Scrapy
Что "это"?
источник

O

Orekhov Web Dev. in Scrapy
href_list
источник

К

Кирилл in Scrapy
Я не понимаю что ты хочешь
источник

O

Orekhov Web Dev. in Scrapy
я получил список ссылок в href_list
они все куда то редиректят
я хочу получить список куда они редиректят
источник

К

Кирилл in Scrapy
Пока ты их не запросишь, ты не узнаешь куда будет редирект, кроме особых случаев, когда закономерность видно. Как посмотреть редиректы, писал выше
источник

К

Кирилл in Scrapy
Финальная ссылка будет в response.url
источник

O

Orekhov Web Dev. in Scrapy
я сломался, не понимаю
источник

S

Sergey in Scrapy
Всем доброй ночи, помню как-то пробегала тема парсинга word файлов, надо выдернуть данные из таблиц(есть doc и docx файлы).
Если кто ткнет носом, буду благодарен
источник

M

Max in Scrapy
делал как то на C# через officetools
источник

S

Sergey in Scrapy
Max
делал как то на C# через officetools
Это жестоко. А средствами python?
С docx ещё понятно можно справиться с помощью либы python-docx.
А вот с Doc, попробывал pypiwin32, но что-то не выходит
источник

i

ildar in Scrapy
Sergey
Всем доброй ночи, помню как-то пробегала тема парсинга word файлов, надо выдернуть данные из таблиц(есть doc и docx файлы).
Если кто ткнет носом, буду благодарен
а что не выходит-то?
источник

i

ildar in Scrapy
я помню как-то делал, но для этого нужна винда с поставленным вордом, чтобы через win32com.client вызывать его в питоне и ресохранять
источник

S

Sergey in Scrapy
ildar
а что не выходит-то?
word = win32.Dispatch("Word.Application")
word.Visible = 0
word.Documents.Open('itog.doc')
doc = word.ActiveDocument

print (doc.Tables.Count)
table = doc.Tables(1)
print(table.Cell(Row =2, Column = 2).Range())
источник

S

Sergey in Scrapy
источник

R

Roma in Scrapy
а python-docx  пробовали ?
источник

S

Sergey in Scrapy
Количество таблиц верное, а вот значение везде такое
источник