Телеграмм чат группы ru_ubuntu страница 18306

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

RU.UBUNTU — Официальное сообщество пользователей Ubuntu

2394 membersпожаловаться на группу

2020 October 28

VM

Vadim Misbakh-Solovi... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

причём, изначальную задачу

источник

11:20пожаловаться #1

АА

Артём Афанасов... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

Nikita DwINS 🐧[Perm]

ну почему же только страницы. wget -nd -r -P /save/location -A jpeg,jpg,bmp,gif,png,mov "http://www.somedomain.com"

html страницы — это в частности. Т.к. мне нужен только текст, а не файлы веб-страниц

источник

11:20пожаловаться #2

VM

Vadim Misbakh-Solovi... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

а не то, как ты придумал её решать

источник

11:20пожаловаться #3

ND

Nikita DwINS 🐧[Perm]... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

Артём Афанасов

html страницы — это в частности. Т.к. мне нужен только текст, а не файлы веб-страниц

текст страницы?

источник

11:20пожаловаться #4

B

BraVo123 in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

Vadim Misbakh-Soloviov

а не то, как ты придумал её решать

+

источник

11:21пожаловаться #5

M

M in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

Чтобы парсить текст страницы надо сначала получить как-то эту страницу

источник

11:21пожаловаться #6

SG

Sergey Gureev in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

Артём Афанасов

Доброго дня! Существует ли утилита для рекурсивного поиска текста на веб-страницах?
Как, например, wget, который рекурсивно может выкачивать все доки

Ты в курсе, что сегодня куча сайтов это не много html-страничек, а SPA или даже PWA?

источник

11:21пожаловаться #7

АА

Артём Афанасов... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

Vadim Misbakh-Soloviov

причём, изначальную задачу

На сайте хочу найти все страницы, на которых присутствуют интересующие меня слова. Руками тыкаться долго. Хочется автомтизировать и хотя бы получить страницы, на которых уже можно серфить и читать инфу.

источник

11:23пожаловаться #8

M

M in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

если ты хочешь парсить интернет, тогда это новый гугл)

источник

11:24пожаловаться #9

M

M in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

поиск с site:website

источник

11:25пожаловаться #10

SG

Sergey Gureev in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

Возьми список allowed страниц из robots.txt питоном и питоном же парси
Это самый простой способ определить, куда ходить можно, а куда не нужно

источник

11:26пожаловаться #11

SG

Sergey Gureev in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

Либо воспользхуйся "поиском по сайту" ог гугла или яндекса, это согратит время мануального поиска

источник

11:26пожаловаться #12

АА

Артём Афанасов... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

Чтобы парсить текст страницы надо сначала получить как-то эту страницу

да придумать связки утилит можно.

Интересует существование команды ubuntu как самый простой вариант

источник

11:27пожаловаться #13

VM

Vadim Misbakh-Solovi... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

нет

источник

11:27пожаловаться #14

АА

Артём Афанасов... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

Либо воспользхуйся "поиском по сайту" ог гугла или яндекса, это согратит время мануального поиска

ctrl + F?
Для этого нужно руками открывать все подстраницы

источник

11:27пожаловаться #15

VM

Vadim Misbakh-Solovi... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

была бы такая команда, провоторговцы уже давно засудили бы всех и вся

источник

11:27пожаловаться #16

VM

Vadim Misbakh-Solovi... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

и авторов и мейнтейнеров

источник

11:27пожаловаться #17

VM

Vadim Misbakh-Solovi... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

есть curl/wget, есть awk/lua/python

источник

11:27пожаловаться #18

VM

Vadim Misbakh-Solovi... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

кому надо - сам пишет парсеры

источник

11:28пожаловаться #19

АА

Артём Афанасов... in RU.UBUNTU — Официальное сообщество пользователей Ubuntu

окей )

источник

11:28пожаловаться #20