КБ
Size: a a a
КБ
А
КБ
КБ
while need_cleaning(string):
string = clean(string)КБ
while need_cleaning(string):
string = clean(string)K
КБ
А
БГ
КБ
БГ
БГ
py3
print("ж".encode())b'\xd0\xb6'
КБ
БГ
БГ
КБ
КБ
КБ
БГ
КБ
UnicodeEncodeError: 'utf-8' codec can't encode characters in position 995-996: surrogates not allowed