Size: a a a

Сообщество Python Программистов

2020 June 19

I

Ingli in Сообщество Python Программистов
import requests
import re

a = requests.get('https://www.youtube.com/watch?v=vxNPA7Fav8o')
b = a.text.encode('utf8')

result = re.findall(r'keywords\\":\[.+],\\"channelId\\"', b.decode('utf8'))

типа вместо этого просто
import requests
import re

a = requests.get('https://www.youtube.com/watch?v=vxNPA7Fav8o')
b = a.text.encode().decode('unicode-escape')

result = re.findall(r'keywords\\":\[.+],\\"channelId\\"', b)

?
источник

l

l|v|l in Сообщество Python Программистов
С одной стороны, я получил, что мне нужно было. Но в выходящем массиве у меня остались лежать 'мусорные' <div class = 'bp_text' </div>. Есть ли какая-то функция/метод в bs4, чтобы сразу грабунть сами значения, лежащие еще на один уровень ниже? Или нужно обрабатывать этот массив как обычный массив, выкидывая из него по отдельности <div class> и </div>?
источник

ПЯ

Просто Ярик... in Сообщество Python Программистов
😳
источник

A

Andrey in Сообщество Python Программистов
l|v|l
С одной стороны, я получил, что мне нужно было. Но в выходящем массиве у меня остались лежать 'мусорные' <div class = 'bp_text' </div>. Есть ли какая-то функция/метод в bs4, чтобы сразу грабунть сами значения, лежащие еще на один уровень ниже? Или нужно обрабатывать этот массив как обычный массив, выкидывая из него по отдельности <div class> и </div>?
Почему бы вообще не перестать использовать регулярки?
источник

Е

Егор Мальцев... in Сообщество Python Программистов
Как отменить ебучую подписку hotspot shield? Задрали бабло списывать
источник

l

l|v|l in Сообщество Python Программистов
Andrey
Почему бы вообще не перестать использовать регулярки?
А шо делать?
источник

A

Andrey in Сообщество Python Программистов
l|v|l
А шо делать?
xpath?
источник

AD

Andrew Dakhnovsky in Сообщество Python Программистов
l|v|l
А шо делать?
парсить хтмл?
только регулярки!
не слушай этих слабаков!
https://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags
источник

I

Ingli in Сообщество Python Программистов
Ingli
import requests
import re

a = requests.get('https://www.youtube.com/watch?v=vxNPA7Fav8o')
b = a.text.encode('utf8')

result = re.findall(r'keywords\\":\[.+],\\"channelId\\"', b.decode('utf8'))

типа вместо этого просто
import requests
import re

a = requests.get('https://www.youtube.com/watch?v=vxNPA7Fav8o')
b = a.text.encode().decode('unicode-escape')

result = re.findall(r'keywords\\":\[.+],\\"channelId\\"', b)

?
Ребят, мне не горит, просто если у кого будет свободное время немного объяснить - буду благодарен
источник

I

Ingli in Сообщество Python Программистов
Решение не нужно, просто какие-то примеры похожие на то что мне нужно хотелось бы увидеть
источник

AD

Andrew Dakhnovsky in Сообщество Python Программистов
Ingli
Решение не нужно, просто какие-то примеры похожие на то что мне нужно хотелось бы увидеть
а шо ты сделать хочешь?
тоже распарсить хтмл и  вытащить оттуда ключевые слова?
источник

I

Ingli in Сообщество Python Программистов
Ну да
источник

AD

Andrew Dakhnovsky in Сообщество Python Программистов
Ingli
Ну да
ну тогда начинаешь гуглить шо такое DOM, xpath, lxml
вот это гуглишь, учишь и парсишь без проблем
быстро и весело
оно конечно децл хард-вей
но тру)))
источник

AD

Andrew Dakhnovsky in Сообщество Python Программистов
источник

I

Ingli in Сообщество Python Программистов
Andrew Dakhnovsky
ну тогда начинаешь гуглить шо такое DOM, xpath, lxml
вот это гуглишь, учишь и парсишь без проблем
быстро и весело
оно конечно децл хард-вей
но тру)))
Спасибо)
источник

AD

Andrew Dakhnovsky in Сообщество Python Программистов
Ingli
Спасибо)
источник

AD

Andrew Dakhnovsky in Сообщество Python Программистов
Ingli
Спасибо)
источник

A

Alexander in Сообщество Python Программистов
потому что metka инициируется по условию, а выводится безусловно
источник

D

DeTaker in Сообщество Python Программистов
Alexander
потому что metka инициируется по условию, а выводится безусловно
Мне просто нужно сделать условие на нажатие кнопки в тг, а оно как я понял не видит callback_data
источник

D

DeTaker in Сообщество Python Программистов
Alexander
потому что metka инициируется по условию, а выводится безусловно
вот с условием
источник