Size: a a a

2020 December 05

🚲U

🚲 Oleh Kopyl UI/UX d... in Python
Подскажите плиз как разделить это на две линии:

if link_not_in_json(job_link, jobs) and job_title_not_in_stop_words(job_title, stop_words):
источник

🚲U

🚲 Oleh Kopyl UI/UX d... in Python
🚲 Oleh Kopyl UI/UX designer
Подскажите плиз как разделить это на две линии:

if link_not_in_json(job_link, jobs) and job_title_not_in_stop_words(job_title, stop_words):
Подсказали

if all([
   one,
   two,
])
источник

🚲U

🚲 Oleh Kopyl UI/UX d... in Python
Помогите с неймингом.

Есть парсер, который проходится по всем страницам и парсит данные.

Но если пройтись им еще few times, то может еще что-то допарсится (особенности сайта).

Как назвать функцию, которая будет делать такую себе "зачистку" – loop over and over till there is no more new data for 3 consecutive iterations.
источник

🚲U

🚲 Oleh Kopyl UI/UX d... in Python
Придумали вместе с одним парнем из чата

scan_leftover_content
источник

А

Алексей in Python
🚲 Oleh Kopyl UI/UX designer
Помогите с неймингом.

Есть парсер, который проходится по всем страницам и парсит данные.

Но если пройтись им еще few times, то может еще что-то допарсится (особенности сайта).

Как назвать функцию, которая будет делать такую себе "зачистку" – loop over and over till there is no more new data for 3 consecutive iterations.
overscan_clear
источник

А

Алексей in Python
вопрос на засыпку:  какой переход по рекламной ссылке, будет защитан за посещение ?  

допустим хочу покликать по google ads

или плохо выразился:
мне достаточно в requests добавить user-agent и accept ?
источник

🚲U

🚲 Oleh Kopyl UI/UX d... in Python
Алексей
overscan_clear
Спасибо
источник

🐍

🐍 in Python
Алексей , вашу репутацию увеличил Oleh Kopyl - UI/UX designer & developer.
Текущая: 2
источник

PA

Pavel Aksenov in Python
🚲 Oleh Kopyl UI/UX designer
Подсказали

if all([
   one,
   two,
])
Чем не нравится
if (
   link_not_in_json(job_link, jobs) and
   job_title_not_in_stop_words(job_title, stop_words)
):

в данном случае если link_not_in_json == False, то job_title_not_in_stop_words вычисляться не будет. А в случае с all должны вычислиться обе функции.
источник

🚲U

🚲 Oleh Kopyl UI/UX d... in Python
Pavel Aksenov
Чем не нравится
if (
   link_not_in_json(job_link, jobs) and
   job_title_not_in_stop_words(job_title, stop_words)
):

в данном случае если link_not_in_json == False, то job_title_not_in_stop_words вычисляться не будет. А в случае с all должны вычислиться обе функции.
Забыл про это вообще, спасибо :)
источник

A

Alex in Python
Алексей
вопрос на засыпку:  какой переход по рекламной ссылке, будет защитан за посещение ?  

допустим хочу покликать по google ads

или плохо выразился:
мне достаточно в requests добавить user-agent и accept ?
Я думаю не достаточно. Почитай вот тут про способы определения ботов https://antoinevastel.com/bot%20detection/2017/08/05/detect-chrome-headless.html
источник

🚲U

🚲 Oleh Kopyl UI/UX d... in Python
О, нунжо будет попробовать эти методы обхода для моего парсера Upwork проектов, а то никак не хочет пропускать меня, скотина
источник

A

Alex in Python
🚲 Oleh Kopyl UI/UX designer
О, нунжо будет попробовать эти методы обхода для моего парсера Upwork проектов, а то никак не хочет пропускать меня, скотина
Headless используешь?
источник

🚲U

🚲 Oleh Kopyl UI/UX d... in Python
Alex
Headless используешь?
Что я только не использовал чтобы обойти
источник

А

Алексей in Python
🚲 Oleh Kopyl UI/UX designer
Что я только не использовал чтобы обойти
селениум ? )
источник

V

Valter in Python
Народ, может у кого был опыт. Написал парсер сайта Авито на requests. Парсит только одну страницу и делает это раз в час.  До поры - до времени это работало норм. Сейчас стали банить. Что я только не делал: менял хедеры, менял ip - один хрен. Скрипт запускаю на ПК, а вот если с этого же ПК захожу через браузер - то все норм. Можете подсказать, как обойти блокировку?
источник

А

Алексей in Python
Valter
Народ, может у кого был опыт. Написал парсер сайта Авито на requests. Парсит только одну страницу и делает это раз в час.  До поры - до времени это работало норм. Сейчас стали банить. Что я только не делал: менял хедеры, менял ip - один хрен. Скрипт запускаю на ПК, а вот если с этого же ПК захожу через браузер - то все норм. Можете подсказать, как обойти блокировку?
здесь ты только про куки не указал
источник

V

Valter in Python
Алексей
здесь ты только про куки не указал
с куки ничего не делал. Да и как? когда браузер заходит - он же без кук. Их я чистил
источник

А

Алексей in Python
Valter
с куки ничего не делал. Да и как? когда браузер заходит - он же без кук. Их я чистил
вот я первый раз на него зашёл, и это всё  у меня прописалось.  Вон интересное значение  lastViewingTime и sessid

и внизу ещё пара sx, u,v
источник

А

Алексей in Python
не знаю за что они отвечают, но смутная мысль, что надо бы их учитывать или разобраться что за они
источник