Телеграмм чат группы rannts страница 4789

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

rannts

300 membersпожаловаться на группу

2021 November 18

KK

Kirill (Cykooz) Kuzm... in rannts

Из всего что я нашёл - это "багу" в процессорах Intel, когда иструкция jmp попадает на границу двух "линий кеша". В этом случае она начинает тормозить.
Но для этого сделали "заплатку" - опция для компилятора, которая делает выравнивание всех jmp, что бы они не тормозили. Но видимо это не всегда помогает, что то там ещё не так может быть.

источник

14:43пожаловаться #1

БС

Байт Словович... in rannts

вспоминаю молодость и плюсы...
выравнивание переменных, использовать только 32 битные (доступ к восьмибитным сильно медленее), данные выравнивать по размеру кешлинии, особенно если разные треды активно используются. Еще какие то были приколы...

источник

14:44пожаловаться #2

с

сонная википедия... in rannts

ну мне кажется, это слишком специфичная вещь

тюнить код настолько имеет смысл, если есть какой-то блок который очень CPU-bound и занимает много времени

пройтись по картинке например

источник

14:45пожаловаться #3

БС

Байт Словович... in rannts

ну кирилл этим и занимается...

источник

14:45пожаловаться #4

KK

Kirill (Cykooz) Kuzm... in rannts

Ладно бы оно всё стабильно было. Может даже тормозило, но стабильно и воспроизводимо.
А у меня получается так, что в прошлом релизе моей библиотеки, конкурент делал работу за 370мс. Я добавил в свою библиотеку новый функционал и конкурент стал делать ту же работу за 480мс.
Единственное что помогает - убрать из бенчмарка мою библиотеку и тестировать всё по отдельности.

источник

14:46пожаловаться #5

с

сонная википедия... in rannts

https://lemire.me/blog/2012/05/31/data-alignment-for-speed-myth-or-reality/

> выравнивание переменных

оно кстати сейчас менее актуально уже

Daniel Lemire's blog

Data alignment for speed: myth or reality?

Some compilers align data structures so that if you read an object using 4 bytes, its memory address is divisible by 4. There are two reasons for data alignment: Some processors require data alignment. For example, the ARM processor in your 2005-era phone might crash if you try to access unaligned data. However, your x86 … Continue reading Data alignment for speed: myth or reality?

источник

14:47пожаловаться #6

KK

Kirill (Cykooz) Kuzm... in rannts

Да, я пишу ресайзер картинок 😊

источник

14:47пожаловаться #7

VB

Vladislav Buldakov in rannts

брр

источник

14:49пожаловаться #8

SZ

Sergey Z in rannts

Жуть какая

источник

14:50пожаловаться #9

БС

Байт Словович... in rannts

мне лень проверять, но он сравнивает структуры int , long, и long long. В зависимости от компилятора и операционки они имеют разный размер.
Во вторых есть подозрение, что компилятор может сильно оптимизировать код и вообще не использовать память, а всё сделать в регистрах. В третьих у него последовательный доступ к массиву в памяти, в этом случае очень эффективно работает предзагрузка памяти.
Нужно проверять рандомный доступ.
В общем у мну большие сомнения в правильности его теста. Но я не исключаю что не которые производители, для некорых процессоров сделали оптимизацию. Но возникает вопрос зачем, если можно легко сказать компилятору чтобы выравнивал 4/8 байтные данные.

источник

15:00пожаловаться #10

KK

Kirill (Cykooz) Kuzm... in rannts

Иногда приходится работать с 3-ёх байтовыйми структурами. Тут всё становится немного сложнее.
А ещё бывают кейсы, когда данные загрузили в память как байты (например из файла). А потом их надо обрабатывать как будто это 32-битные целые. И тут остаётся только выдавать ошибку в рантайме, что данные не выровнены и надеяться на то, что обычно аллокаторы выдают память из кучи уже достаточно выровненную, даже если выделяли память под байты.

источник

15:27пожаловаться #11

БС

Байт Словович... in rannts

а в чем проблема?
Выделаешь памяти n+31.
Проверяешь адресс и добавляешь нужное смещение (скорее всего почти всегда будет 0) и дальше SSE и другие многобайтные инструкции

источник

15:29пожаловаться #12

KK

Kirill (Cykooz) Kuzm... in rannts

Ну так это может быть например RGB изображение без выравнивания строк (пиксели тем более не выровнены - идут подряд, без зазоров). Т.е. в общем случае каждая строка такого изображения может быть не выровнена вообще ни по какой границе.

источник

15:31пожаловаться #13

БС

Байт Словович... in rannts

когда то я пытался демосценой заниматься. Мы тогда всегда 4байта использовали. Просто один байт всегда ноль. Оперативки немного лишнего используется, зато всё гораздо быстрее было

источник

15:31пожаловаться #14

БС

Байт Словович... in rannts

так ты же не построчно изображение обрабатываешь, а всё целиком

источник

15:32пожаловаться #15

KK

Kirill (Cykooz) Kuzm... in rannts

Ну вот Pillow так и делает - там RGB картинки всё равно занимают 4 байта. А вот в Rust есть библиотека Image, там пиксели в RGB картинках - это массивы из 3-ёх байт. Пришлось в своей либе делать поддержку такого формата.

источник

15:33пожаловаться #16

KK

Kirill (Cykooz) Kuzm... in rannts

Если всякие SIMD использую, то сразу обрабатываю по 4 или 2 строки на первом проходе (сжатие по горизонтали). А на втором проходе (сжатие по вертикали) приходится скакать именно по строкам, даже если не использую SIMD.

источник

15:34пожаловаться #17

KK

Kirill (Cykooz) Kuzm... in rannts

Хотя тут стоит сказать, что вероятно в статье есть доля правды. У меня примерно одинаковая скорость ресайза 4-ёх байтовой картинки и точно такой же 3-ёх байтовой (без использования SIMD). Около 10% разница (106мс и 117мс). Вроде как в статье у него такая же была.

источник

15:40пожаловаться #18

AG

Alexander Gorokhov in rannts

Снимок.JPG

Ща будет мясо

источник

17:53пожаловаться #19

SZ

Sergey Z in rannts

209? Негуманно

источник

17:58пожаловаться #20