Телеграмм чат группы cpptogether страница 1863

Если я не еблан, то такие инструкции используют подход SIMD — single instruction multiple data, то есть одна инструкция процессора применяется к куче данных
Как итог: если тебе нужно натравить кучу одинаковых инструкций на набор схожих данных, то с векторными инструкциями это всё сотворится в прилично раз быстрее

источник

17:57пожаловаться #10

AF

Aidar Fattakhov in C++ Together 2.0

Evgeniy Pichuzhkin

Если я не еблан, то такие инструкции используют подход SIMD — single instruction multiple data, то есть одна инструкция процессора применяется к куче данных
Как итог: если тебе нужно натравить кучу одинаковых инструкций на набор схожих данных, то с векторными инструкциями это всё сотворится в прилично раз быстрее

Ну не сильно

источник

17:58пожаловаться #11

CC

Cool Cooler in C++ Together 2.0

Evgeniy Pichuzhkin

Если я не еблан, то такие инструкции используют подход SIMD — single instruction multiple data, то есть одна инструкция процессора применяется к куче данных
Как итог: если тебе нужно натравить кучу одинаковых инструкций на набор схожих данных, то с векторными инструкциями это всё сотворится в прилично раз быстрее

Ааа, спс

источник

17:58пожаловаться #12

AF

Aidar Fattakhov in C++ Together 2.0

В раз 5 кажется

источник

17:58пожаловаться #13

EP

Evgeniy Pichuzhkin in C++ Together 2.0

Условно, если надо прокрутить 1 инструкцию для 4 участков памяти, то вместо 4 обычных инструкций можно использовать одну векторную
Это в общем-то будет быстрее

источник

17:59пожаловаться #14

🦊

🦊fox.cpp in C++ Together 2.0

Как-то давно такая дискуссия была с @foxpy, чем вообще является векторный юнит в CPU? Если дан гиперскалярный CPU, а векторный юнит - пачка "смотанных" вместе ALU, то профит векторных операций над обычными только в отсутствии оверхеда декодера инструкций, их щедулера и прочего, что происходит до фактического выполнения операции?

источник

18:00пожаловаться #15

🦊

🦊fox.cpp in C++ Together 2.0

Кароче говоря, почему одно какое-нибудь векторное сложение быстрее N-ых отдельных инструкций на гиперскалярном CPU?

источник

18:01пожаловаться #16

EP

Evgeniy Pichuzhkin in C++ Together 2.0

Я слов то таких не знаю, поэтому откланиваюсь дальше раковать >_<

источник

18:01пожаловаться #17

AF

Aidar Fattakhov in C++ Together 2.0

🦊fox.cpp

Как-то давно такая дискуссия была с @foxpy, чем вообще является векторный юнит в CPU? Если дан гиперскалярный CPU, а векторный юнит - пачка "смотанных" вместе ALU, то профит векторных операций над обычными только в отсутствии оверхеда декодера инструкций, их щедулера и прочего, что происходит до фактического выполнения операции?

Там еще синхронизации между операциями

источник

18:01пожаловаться #18

CC

Cool Cooler in C++ Together 2.0

А одна векторная инструкция выполняется дольше одной обычной?

источник

18:03пожаловаться #19

AF

Aidar Fattakhov in C++ Together 2.0

Еще чтение и запись склеены вместе и цпу не нужно вдуплять что их можно склеить

источник

18:03пожаловаться #20