Телеграмм чат группы ruosm страница 13214

господа - а кто нибудь может подсказать как в гугл забить вопрос правильно... мне нужно хеш функцию, но которая намеренно неточная. то есть если я ей дал на вход "авбг22" и "авбг25" она была одинакова или схожа. я как-то читал про такое, но забыл как это называлось

источник

17:11пожаловаться

IZ

Ilya Zverev in OpenStreetMap RU

Язык?

источник

17:15пожаловаться

IZ

Ilya Zverev in OpenStreetMap RU

Погугли Левенштейн

источник

17:15пожаловаться

КГ

Константин Гам in OpenStreetMap RU

ок

источник

17:21пожаловаться

КГ

Константин Гам in OpenStreetMap RU

python вполне проатитт

источник

17:21пожаловаться

ПЖ

Павел Жирнов in OpenStreetMap RU

и 70% офисного плантктона не знает чего иного акромя мс офиса :)

источник

17:24пожаловаться

IZ

Ilya Zverev in OpenStreetMap RU

Константин Гам

python вполне проатитт

Почитай @ohmypy, там недавно про это было

источник

17:24пожаловаться

КГ

Константин Гам in OpenStreetMap RU

собственно по Левенштену я нашел кучу материала и кучу подобных алгоритмов

источник

17:25пожаловаться

КГ

Константин Гам in OpenStreetMap RU

спасибо

источник

17:25пожаловаться

КГ

Константин Гам in OpenStreetMap RU

самый банальный реализован прям в языке similar_text() 0o

источник

17:25пожаловаться

IZ

Ilya Zverev in OpenStreetMap RU

Сравнить строки на похожесть

Помните ваш стартап с самыми актуальными новостями дня? Кажется, у него появился конкурент — он нагло крадёт ваши аутентичные новости, рерайтит их, и рассылает ничего не подозревающим клиентам, подрывая вашу репутацию.

Судите сами, вот ваши новости:

genuine = [
  "«Братец-хлеб» из Китая носит плащ и корону из булочек, чтобы кормить чаек",
  "Мясо гигантских тараканов станет вкусной и недорогой альтернативой говядине",
  "Скандал в ботаническом саду: 10 миллионов рублей ушло на зарплату кактусам",
]

А вот новости жалкого подражателя:

plagiary = [
  "Китайский хлебный братец кормит чаек плащом и короной из булочек",
  "Гигантское мясо тараканов станет говядине недорогой и вкусной альтернативой",
  "Зарплата кактусов в ботаническом саду составила 10 скандальных миллионов рублей",
]

Нужны какие-то основания для судебного иска, и нужны быстро. Хорошо, что в стандартной библиотеке Питона есть модуль difflib. Сделаем на нём функцию сравнения:

import difflib

def similarity(s1, s2):
  normalized1 = s1.lower()
  normalized2 = s2.lower()
  matcher = difflib.SequenceMatcher(None, normalized1, normalized2)
  return matcher.ratio()

И сравним:

similarity(genuine[0], plagiary[0])
0.51

similarity(genuine[1], plagiary[1])
0.69

similarity(genuine[2], plagiary[2])
0.55

АГА! 51%, 69% и 55% похожести! Всё ясно, какие ещё нужны доказательства.

источник

17:26пожаловаться

l

lite in OpenStreetMap RU

Павел Жирнов

и 70% офисного плантктона не знает чего иного акромя мс офиса :)

70? ты очень оптимистичен

источник

17:26пожаловаться

КГ

Константин Гам in OpenStreetMap RU

Ilya Zverev

Сравнить строки на похожесть

Помните ваш стартап с самыми актуальными новостями дня? Кажется, у него появился конкурент — он нагло крадёт ваши аутентичные новости, рерайтит их, и рассылает ничего не подозревающим клиентам, подрывая вашу репутацию.

Судите сами, вот ваши новости:

genuine = [
  "«Братец-хлеб» из Китая носит плащ и корону из булочек, чтобы кормить чаек",
  "Мясо гигантских тараканов станет вкусной и недорогой альтернативой говядине",
  "Скандал в ботаническом саду: 10 миллионов рублей ушло на зарплату кактусам",
]

А вот новости жалкого подражателя:

plagiary = [
  "Китайский хлебный братец кормит чаек плащом и короной из булочек",
  "Гигантское мясо тараканов станет говядине недорогой и вкусной альтернативой",
  "Зарплата кактусов в ботаническом саду составила 10 скандальных миллионов рублей",
]

Нужны какие-то основания для судебного иска, и нужны быстро. Хорошо, что в стандартной библиотеке Питона есть модуль difflib. Сделаем на нём функцию сравнения:

import difflib

def similarity(s1, s2):
  normalized1 = s1.lower()
  normalized2 = s2.lower()
  matcher = difflib.SequenceMatcher(None, normalized1, normalized2)
  return matcher.ratio()

И сравним:

similarity(genuine[0], plagiary[0])
0.51

similarity(genuine[1], plagiary[1])
0.69

similarity(genuine[2], plagiary[2])
0.55

АГА! 51%, 69% и 55% похожести! Всё ясно, какие ещё нужны доказательства.

http://php.net/manual/ru/function.levenshtein.php =)

источник

17:26пожаловаться

ПЖ

Павел Жирнов in OpenStreetMap RU

у крутых есть макбуки :)
хотя пользуются они ими как виндой :)

источник

17:27пожаловаться

ПЖ

Павел Жирнов in OpenStreetMap RU

че за е*ный стыд

— Валежник можно собирать только для личных нужд, — объясняют суть нового закона в комитете природных ресурсов Волгоградской области. — Собранный валежник законом категорически запрещается продавать. Кроме этого, чтобы граждане не путали валежник с ценными природными ресурсами, его сбор будет контролироваться. Для этого каждый житель, отправляясь в лес, должен получить разрешение лесничества. Нужно сообщать о времени и месте сбора валежника.

источник

17:28пожаловаться

ВК

Владимир К in OpenStreetMap RU

где есть актуальные выгрузки по регионам кроме некстгиса? или только самому вырезать?

источник

17:28пожаловаться

V

VlIvYur in OpenStreetMap RU

Павел Жирнов

че за е*ный стыд

— Валежник можно собирать только для личных нужд, — объясняют суть нового закона в комитете природных ресурсов Волгоградской области. — Собранный валежник законом категорически запрещается продавать. Кроме этого, чтобы граждане не путали валежник с ценными природными ресурсами, его сбор будет контролироваться. Для этого каждый житель, отправляясь в лес, должен получить разрешение лесничества. Нужно сообщать о времени и месте сбора валежника.

Всё для удобства.Должно быть ещё "за месяц до"

источник

17:32пожаловаться