Size: a a a

2020 July 09

ИК

Илья Курьянов... in Modern::Perl
о и o, скажем, имеют разные коды, но вполне себе один и тот же символ
источник

МИ

Михаил Иванов... in Modern::Perl
кодепойнт
источник

ИК

Илья Курьянов... in Modern::Perl
А, в смысле, такой кодепойнт, который можно двумя разными способами в utf-8 представить?
источник

МИ

Михаил Иванов... in Modern::Perl
ну да, о чем изначально и зашла речь
источник

S

Sergey in Modern::Perl
Илья Курьянов
А, в смысле, такой кодепойнт, который можно двумя разными способами в utf-8 представить?
источник

VG

Vadim Goncharov in Modern::Perl
One place where U+0061 LATIN SMALL LETTER A U+0308 COMBINING DIAERESIS would be the way to express “ä” would be Max OS X filenames, which require a specific version of NFD. – hippietrail Apr 13 '13 at 12:50
источник

VG

Vadim Goncharov in Modern::Perl
хехе
источник

VG

Vadim Goncharov in Modern::Perl
и таких граблей по миру с юникодом - тонны
источник

ИК

Илья Курьянов... in Modern::Perl
Ну это не то, это нормальные формы для последовательностей кодепоинтов, они про то, как одну последовательность привести к другой, которая должна выглядеть так же.
источник

S

Sergey in Modern::Perl
А начиная с apfs - макось не форсит нормализацию. И это жопа. Полная.
источник

ИК

Илья Курьянов... in Modern::Perl
А тут речь про то, как один и тот же кодепоинт закодировать двумя разными способами в UTF-8.
источник

ИК

Илья Курьянов... in Modern::Perl
И, кажется, по стандарту всё-таки никак.
источник

VG

Vadim Goncharov in Modern::Perl
ну суррогатные пары же
источник

S

Sergey in Modern::Perl
С суррогатными парами будет только utf-16
источник

ИК

Илья Курьянов... in Modern::Perl
Нет в UTF-8 суррогатных пар.
источник

VG

Vadim Goncharov in Modern::Perl
ты хотел сказать, должен быть
источник

VG

Vadim Goncharov in Modern::Perl
но куча софта это проверять не будет
источник

VG

Vadim Goncharov in Modern::Perl
даже перл, даже телега)
источник

S

Sergey in Modern::Perl
Перл проверяет где-то с 20й версии
источник

МИ

Михаил Иванов... in Modern::Perl
Короче говоря нет таких символов, которые кодируются разными кодами в утф
источник