Size: a a a

2019 January 29

П

П3тр0виЧъ in OpenStreetMap RU
Чот про платные маршруты втирают
источник

b

batyrmastyr in OpenStreetMap RU
Ilya Zverev
Это канал про аниме? У нас скоро будет новый «бибоп»: https://www.kinoafisha.info/news/miray-iz-buduschego-i-buduschee-anime-na-netflix/
Боевого ангела Алиту совсем на днях показывать начнут. В день всех влюблённых 😂
источник

IZ

Ilya Zverev in OpenStreetMap RU
batyrmastyr
Боевого ангела Алиту совсем на днях показывать начнут. В день всех влюблённых 😂
Ага, вернусь с fosdem, обязательно схожу
источник

КГ

Константин Гам in OpenStreetMap RU
господа - а кто нибудь может подсказать как в гугл забить вопрос правильно... мне нужно хеш функцию, но которая намеренно неточная. то есть если я ей дал на вход "авбг22" и "авбг25" она была одинакова или схожа. я как-то читал про такое, но забыл как это называлось
источник

IZ

Ilya Zverev in OpenStreetMap RU
Язык?
источник

IZ

Ilya Zverev in OpenStreetMap RU
Погугли Левенштейн
источник

КГ

Константин Гам in OpenStreetMap RU
ок
источник

КГ

Константин Гам in OpenStreetMap RU
python вполне проатитт
источник

ПЖ

Павел Жирнов in OpenStreetMap RU
и 70% офисного плантктона не знает чего иного акромя мс офиса :)
источник

IZ

Ilya Zverev in OpenStreetMap RU
Константин Гам
python вполне проатитт
Почитай @ohmypy, там недавно про это было
источник

КГ

Константин Гам in OpenStreetMap RU
собственно по Левенштену я нашел кучу материала и кучу подобных алгоритмов
источник

КГ

Константин Гам in OpenStreetMap RU
спасибо
источник

КГ

Константин Гам in OpenStreetMap RU
самый банальный реализован прям в языке similar_text() 0o
источник

IZ

Ilya Zverev in OpenStreetMap RU
Сравнить строки на похожесть

Помните ваш стартап с самыми актуальными новостями дня? Кажется, у него появился конкурент — он нагло крадёт ваши аутентичные новости, рерайтит их, и рассылает ничего не подозревающим клиентам, подрывая вашу репутацию.

Судите сами, вот ваши новости:

genuine = [
 "«Братец-хлеб» из Китая носит плащ и корону из булочек, чтобы кормить чаек",
 "Мясо гигантских тараканов станет вкусной и недорогой альтернативой говядине",
 "Скандал в ботаническом саду: 10 миллионов рублей ушло на зарплату кактусам",
]


А вот новости жалкого подражателя:

plagiary = [
 "Китайский хлебный братец кормит чаек плащом и короной из булочек",
 "Гигантское мясо тараканов станет говядине недорогой и вкусной альтернативой",
 "Зарплата кактусов в ботаническом саду составила 10 скандальных миллионов рублей",
]


Нужны какие-то основания для судебного иска, и нужны быстро. Хорошо, что в стандартной библиотеке Питона есть модуль difflib. Сделаем на нём функцию сравнения:

import difflib

def similarity(s1, s2):
 normalized1 = s1.lower()
 normalized2 = s2.lower()
 matcher = difflib.SequenceMatcher(None, normalized1, normalized2)
 return matcher.ratio()


И сравним:
similarity(genuine[0], plagiary[0])
0.51

similarity(genuine[1], plagiary[1])
0.69

similarity(genuine[2], plagiary[2])
0.55


АГА! 51%, 69% и 55% похожести! Всё ясно, какие ещё нужны доказательства.
источник

l

lite in OpenStreetMap RU
Павел Жирнов
и 70% офисного плантктона не знает чего иного акромя мс офиса :)
70? ты очень оптимистичен
источник

КГ

Константин Гам in OpenStreetMap RU
Ilya Zverev
Сравнить строки на похожесть

Помните ваш стартап с самыми актуальными новостями дня? Кажется, у него появился конкурент — он нагло крадёт ваши аутентичные новости, рерайтит их, и рассылает ничего не подозревающим клиентам, подрывая вашу репутацию.

Судите сами, вот ваши новости:

genuine = [
 "«Братец-хлеб» из Китая носит плащ и корону из булочек, чтобы кормить чаек",
 "Мясо гигантских тараканов станет вкусной и недорогой альтернативой говядине",
 "Скандал в ботаническом саду: 10 миллионов рублей ушло на зарплату кактусам",
]


А вот новости жалкого подражателя:

plagiary = [
 "Китайский хлебный братец кормит чаек плащом и короной из булочек",
 "Гигантское мясо тараканов станет говядине недорогой и вкусной альтернативой",
 "Зарплата кактусов в ботаническом саду составила 10 скандальных миллионов рублей",
]


Нужны какие-то основания для судебного иска, и нужны быстро. Хорошо, что в стандартной библиотеке Питона есть модуль difflib. Сделаем на нём функцию сравнения:

import difflib

def similarity(s1, s2):
 normalized1 = s1.lower()
 normalized2 = s2.lower()
 matcher = difflib.SequenceMatcher(None, normalized1, normalized2)
 return matcher.ratio()


И сравним:
similarity(genuine[0], plagiary[0])
0.51

similarity(genuine[1], plagiary[1])
0.69

similarity(genuine[2], plagiary[2])
0.55


АГА! 51%, 69% и 55% похожести! Всё ясно, какие ещё нужны доказательства.
источник

ПЖ

Павел Жирнов in OpenStreetMap RU
у крутых есть макбуки :)
хотя пользуются они ими как виндой :)
источник

ПЖ

Павел Жирнов in OpenStreetMap RU
че за е*ный стыд

— Валежник можно собирать только для личных нужд, — объясняют суть нового закона в комитете природных ресурсов Волгоградской области. — Собранный валежник законом категорически запрещается продавать. Кроме этого, чтобы граждане не путали валежник с ценными природными ресурсами, его сбор будет контролироваться. Для этого каждый житель, отправляясь в лес, должен получить разрешение лесничества. Нужно сообщать о времени и месте сбора валежника.
источник

ВК

Владимир К in OpenStreetMap RU
где есть актуальные выгрузки по регионам кроме некстгиса? или только самому вырезать?
источник

V

VlIvYur in OpenStreetMap RU
Павел Жирнов
че за е*ный стыд

— Валежник можно собирать только для личных нужд, — объясняют суть нового закона в комитете природных ресурсов Волгоградской области. — Собранный валежник законом категорически запрещается продавать. Кроме этого, чтобы граждане не путали валежник с ценными природными ресурсами, его сбор будет контролироваться. Для этого каждый житель, отправляясь в лес, должен получить разрешение лесничества. Нужно сообщать о времени и месте сбора валежника.
Всё для удобства.Должно быть ещё "за месяц до"
источник