Size: a a a

2021 January 26

VR

Victor Ryabinin in rannts
на входе нет строк, только текст с эмодзями
источник

KK

Kirill (Cykooz) Kuzm... in rannts
Victor Ryabinin
на входе нет строк, только текст с эмодзями
Сканируй его и превращай в список символов.
Но конечно только в кейсе если тебе надо потом часто этим списком пользоваться с использованием индексов. Если один раз найти символ - то можно список и не создавать, а один раз просканировать до нужного символа.
источник

VR

Victor Ryabinin in rannts
не все так просто, в любом мессенджере есть баги на эту тему, до сих пор работающие в т.ч.
источник

VR

Victor Ryabinin in rannts
особенно, когде не знаешь, какой символ - нужный
источник

БС

Байт Словович... in rannts
Я ваще не понимаю что вы тут заобсуждали..
можно ли напрямик вставлять символы аля  ° -- можно и нужно. Так всем понятен этот символ, а /uxxxx на память врядли кто помнит.
Если кто то будет злоупотреблять с 🅰️🆎🅱️  сам себе злобный буратино, на ревью дать по рукам.

если прям страдания, то можно объявить переменные DEGREE = "°"
источник

KK

Kirill (Cykooz) Kuzm... in rannts
В деталях я наверное могу путать, но вроде в юникоде есть отдельные понятия код-поинта и графемы. Одна графема может состоять от 1 до N код-поинтов. В питоне скорее всего "индексация" идёт по код-поинтам, поэтому и возникают вот те баги что выше. А что бы работать с графемами - надо обрабатывать строку как поток (т.е. без возможности случайного доступа в любое место строки).
источник

VR

Victor Ryabinin in rannts
> если прям страдания, то можно объявить переменные DEGREE = "°"
по мне - самый правильный вариант
источник

БС

Байт Словович... in rannts
Kirill (Cykooz) Kuzminykh
Сканируй его и превращай в список символов.
Но конечно только в кейсе если тебе надо потом часто этим списком пользоваться с использованием индексов. Если один раз найти символ - то можно список и не создавать, а один раз просканировать до нужного символа.
я так понял, руслану надо текстовый строки делать.. Нафиг ему доступ к строкам по индексу? Вообще кому последний раз понадобилось работать со строкой и доставать что то по индексу?
источник

БС

Байт Словович... in rannts
мне вот только чтобы парсить сообщения из внешней системы..
источник

💭П

💭 Руслан Прохоров... in rannts
Байт Словович
я так понял, руслану надо текстовый строки делать.. Нафиг ему доступ к строкам по индексу? Вообще кому последний раз понадобилось работать со строкой и доставать что то по индексу?
имено так. И я не понимаю, зачем в строки которые идут в репорт мне писать с использованием \u/
источник

VR

Victor Ryabinin in rannts
Kirill (Cykooz) Kuzminykh
В деталях я наверное могу путать, но вроде в юникоде есть отдельные понятия код-поинта и графемы. Одна графема может состоять от 1 до N код-поинтов. В питоне скорее всего "индексация" идёт по код-поинтам, поэтому и возникают вот те баги что выше. А что бы работать с графемами - надо обрабатывать строку как поток (т.е. без возможности случайного доступа в любое место строки).
иногда графемы состоят из других графем
источник

VR

Victor Ryabinin in rannts
Victor Ryabinin
Переслано от Victor Ryabinin
еще вот так попробуйте
print('👨‍👩‍👧‍👧'[::-1])
:)
вот выше пример был, это 4 графемы, объединенные в 1
источник

VR

Victor Ryabinin in rannts
Victor Ryabinin
вот выше пример был, это 4 графемы, объединенные в 1
телеграм поймет ее и будет 1 символ, другой мессенджер, который не поддерживает этот стандарт эмодзей отобразит
источник

💭П

💭 Руслан Прохоров... in rannts
Victor Ryabinin
вот выше пример был, это 4 графемы, объединенные в 1
источник

💭П

💭 Руслан Прохоров... in rannts
Victor Ryabinin
телеграм поймет ее и будет 1 символ, другой мессенджер, который не поддерживает этот стандарт эмодзей отобразит
так это со всеми символами работает? или только с эмодзи?
источник

БС

Байт Словович... in rannts
💭 Руслан Прохоров
имено так. И я не понимаю, зачем в строки которые идут в репорт мне писать с использованием \u/
за тем, что у кого то "мышечная" память.  Раньше, когда не везде был utf8, а код билдили с поддержкой unicode и нет (кто помнит эти времена ? ), редакторы часто криво поддерживали уникод, и вот тогда приходилось использовать \uxxx .  Кстати, я помню была какая то бага с svn, когда utf-8 файл закамитил. Толи дельта была закарапчена, то ли еще какая то проблема была.
Но славу богу, эти проблемы давно миновали. Проси коллегу объяснить нах ему нужны \uxxx
источник

VR

Victor Ryabinin in rannts
💭 Руслан Прохоров
так это со всеми символами работает? или только с эмодзи?
эмодзи - тоже юникод символы или наборы юникод символов, я только хотел сказать, что не указывая четко код или не выделяя в отдельную переменную можно словить разные баги, а можно и не словить, если у вас на весь код только те 3 значка
источник

💭П

💭 Руслан Прохоров... in rannts
Байт Словович
за тем, что у кого то "мышечная" память.  Раньше, когда не везде был utf8, а код билдили с поддержкой unicode и нет (кто помнит эти времена ? ), редакторы часто криво поддерживали уникод, и вот тогда приходилось использовать \uxxx .  Кстати, я помню была какая то бага с svn, когда utf-8 файл закамитил. Толи дельта была закарапчена, то ли еще какая то проблема была.
Но славу богу, эти проблемы давно миновали. Проси коллегу объяснить нах ему нужны \uxxx
а тут хуже он вообще из паралельной команды но считает себя великим архитектором Python =)
источник

💭П

💭 Руслан Прохоров... in rannts
Но так как толлерантность и всё такое, на той стороне его тоже осадить видимо не могут (
источник

💭П

💭 Руслан Прохоров... in rannts
а мы контрактеры (
источник