Size: a a a

2021 August 26

c

codingteam@cjr in codingteam
Minoru
давай. Берём верхние 128 кодпоинтов KOI8-R, находим соответствующие Unicode codepoints. Образованные пары считаем координатами на плоскости и подбираем полином 129-й степени такой, что для любого числа от 128 до 2^32 полином принимает уникальное значение от 128 до 2^32 (не уверен, что это возможно). В итоге первые 128 кодпоинтов KOI32-R скопированы из ASCII, а остальные замаплены из Unicode с помощью полинома
источник

t

ttldtor in codingteam
эм, а обратная совместимость с KOI7 сохранится?
источник

t

ttldtor in codingteam
хотя, вроде да
источник

t

ttldtor in codingteam
только там не из ASCII надо копировать
источник

t

ttldtor in codingteam
надо копировать из KOI8-R
источник

t

ttldtor in codingteam
а остальное маппить
источник

t

ttldtor in codingteam
хотя, что делать с остальными 128 символами?
источник

c

codingteam@cjr in codingteam
Minoru
по-моему, не сохранится. В KOI-7 какое-то переключение между таблицами, а в KOI32-R будет stateless: просто берёшь четыре байта и мапишь в Юникод
источник

💮

💮 in codingteam
А зачем полином?
источник

c

codingteam@cjr in codingteam
Minoru
чтобы запутать соответствия кодов так же, как это сделано для [128; 256]
источник

💮

💮 in codingteam
А, запутать.
источник

💮

💮 in codingteam
Это мы любим.
источник

c

codingteam@cjr in codingteam
Minoru
так-то да, можно было просто взять Юникод и написать для него табличку перестановок: какие кодпоинты меняются с какими
источник

c

codingteam@cjr in codingteam
Minoru
(вариант «просто взять Юникод» отсекается бритвой Оккама. Если кто-то рискнёт сказать, что я её неправильно использую — тому я тоже что-нибудь отсеку! :)
источник

💮

💮 in codingteam
Ну, в духе koi8 было бы для переупорядочить буквы для всех языков так, чтобы фонетически соответствовать латинскому алфавиту.
источник

t

ttldtor in codingteam
каждый раз, когда кто-то берёт бритву Оккама, к её имени добавляется GUID
источник

c

codingteam@cjr in codingteam
Minoru
фигасе проклятие
источник

t

ttldtor in codingteam
не могут же люди одной и той же бритвой пользоваться?
источник

c

codingteam@cjr in codingteam
Minoru
а, погоди, к *её* имени. Ладно
источник

c

codingteam@cjr in codingteam
Minoru
я почему-то сначала прочитал «его имени», т.е. имени берущего. Это было забавнее: берёшь инструмент для отсечения лишнего, и тут же в мире становится чуть больше лишнего!
источник