Size: a a a

2020 January 02

ᔕEᖇG in aiogram [ru]
придется все знаки убирать
источник

ЮЧ

Юрий 👨‍🔬 Чебышев in aiogram [ru]
Юрий 👨‍🔬 Чебышев
Имей в виду все ещё остаются ошибки от несоответствий 'on' и 'on.' и 'on,' сплит делит по пробелам знаки препинания приклеиваются к одному из элементов, а если пробелы с обоих сторон '... - ...' то и вообще становятся отдельным элементом.
Это можно пофиксить написав функцию которая в каком-то смысле тримит список, удаляя из начала и конца небуквы (напрашивается регулярка) и ещё специальное поведение для удаления элемента целиком если в нем только небуквы и разделение элемента надвое если юзер не поставил пробел типа "привет,мир"
источник

ᔕEᖇG in aiogram [ru]
ух работы подкинул конечно...
источник

️️

️️👑OGURCHIK 🖤 ️ in aiogram [ru]
🤔 да либу найти которая слова достает
источник

️️

️️👑OGURCHIK 🖤 ️ in aiogram [ru]
И все
источник

ЮЧ

Юрий 👨‍🔬 Чебышев in aiogram [ru]
️️👑OGURCHIK 🖤 ️
🤔 да либу найти которая слова достает
Вариант да
источник

ЮЧ

Юрий 👨‍🔬 Чебышев in aiogram [ru]
Я обычно сначала пишу свою реализацию, а потом думаю: наверняка я не первый🤔 и точно😅
источник

S

Senpos in aiogram [ru]
️️👑OGURCHIK 🖤 ️
🤔 да либу найти которая слова достает
Ага. в nltk есть токенайзер слов
источник

️️

️️👑OGURCHIK 🖤 ️ in aiogram [ru]
re.findall(r'\w+', test_string)
источник

S

Senpos in aiogram [ru]
Ну или можно вот так, по деревенски:

import re
from collections import Counter
from dataclasses import dataclass
from typing import Iterable


@dataclass(frozen=True)
class Post:
   name: str
   link: str

posts = [Post(...), ...]

def find(query: str, posts: Iterable[Post]) -> dict:
   words = re.findall(r"\w+", query)
   matching_posts = Counter()
   for post in posts:
       for word in words:
           if not re.match(rf"\b{word}\b", post.name, re.IGNORECASE):
               continue
           matching_posts[post] += 1
   return matching_posts.most_common()
источник

S

Senpos in aiogram [ru]
️️👑OGURCHIK 🖤 ️
re.findall(r'\w+', test_string)
Огурчик шарит
источник

ᔕEᖇG in aiogram [ru]
источник

ᔕEᖇG in aiogram [ru]
️️👑OGURCHIK 🖤 ️
re.findall(r'\w+', test_string)
)))
источник

️️

️️👑OGURCHIK 🖤 ️ in aiogram [ru]
вот. только сразу гугли а потом вопросы
источник

️️

️️👑OGURCHIK 🖤 ️ in aiogram [ru]
несложно жы
источник

ЮЧ

Юрий 👨‍🔬 Чебышев in aiogram [ru]
️️👑OGURCHIK 🖤 ️
re.findall(r'\w+', test_string)
Я все думал как бы без регулярок, а том меня за них обычно ругают в чатах))
источник

ᔕEᖇG in aiogram [ru]
Юрий 👨‍🔬 Чебышев
Я все думал как бы без регулярок, а том меня за них обычно ругают в чатах))
+++
источник

ᔕEᖇG in aiogram [ru]
боюс баюс
источник

️️

️️👑OGURCHIK 🖤 ️ in aiogram [ru]
Юрий 👨‍🔬 Чебышев
Я все думал как бы без регулярок, а том меня за них обычно ругают в чатах))
туто задача специфическая
источник

S

Senpos in aiogram [ru]
Если не нахуевертить ими чего-то супер-сложного - нечего их бояться
источник