Телеграмм чат группы compilerdev страница 1272

TGG

А на русском нет? Я знаю иностранные языки просто для сверки, вдруг что упущу.

Официальной, насколько мне известно, нет.

01:01пожаловаться #1

MO

Rifat S

Для VLIW архитектуры нужен хороший компилятор, который может распараллеливать код, который написал программист, на параллельные команды. Такой компилятор написать гораздо сложнее, чем компилятор для обычного x86. Плюс код становится непереносимым, если у одного VLIW 4 команды одновременно могут выполняться, а у другого 19, то код будет несовместим. Возможно, поэтому эта архитектура не очень распространена.

В реальности современный суперскаляр есть рисковый влив, поверх которого построен хардварный оптимизирующий компилятор

01:03пожаловаться #2

T

TGG in Compiler Development

Официальной, насколько мне известно, нет.

Я не приверженец всего лицензионного. Можно и просто гайд как например по C++

01:05пожаловаться #3

MO

Rifat S

А есть здесь компиляторщики, которые сами разрабатывают оптимизирующие компиляторы без LLVM?

Как показывает опыт, если стоит цель выжать максимум из архитектуры, то приходится писать компилятор без ллвм

01:07пожаловаться #4

K

Kitsu in Compiler Development

Rifat S

Для VLIW архитектуры нужен хороший компилятор, который может распараллеливать код, который написал программист, на параллельные команды. Такой компилятор написать гораздо сложнее, чем компилятор для обычного x86. Плюс код становится непереносимым, если у одного VLIW 4 команды одновременно могут выполняться, а у другого 19, то код будет несовместим. Возможно, поэтому эта архитектура не очень распространена.

Есть подозрение, что типичный десктопный/сервеный код плохо паралелится на уровне инчтрукций, особоенно если у вас цепочка load-store (что крайне часто по моему не особо большому опыту)

01:13пожаловаться #5

MO

Kitsu

Есть подозрение, что типичный десктопный/сервеный код плохо паралелится на уровне инчтрукций, особоенно если у вас цепочка load-store (что крайне часто по моему не особо большому опыту)

Хорошо написанный оптимизирующийся компилятор умеет разрывать такие цепочки

01:15пожаловаться #6

MO

Если же они не разрываются, то тут уже не важно, влив или не влив это, помогает только многоуровневый кэш

Alexander Nasonov in Compiler Development

01:15пожаловаться #7

AN

Как показывает опыт, если стоит цель выжать максимум из архитектуры, то приходится писать компилятор без ллвм

А контрибутить в ллвм не вариант?

Igor 🐱 Jirkov in Compiler Development

01:30пожаловаться #8

IJ

TGG

В этом и суть)

Я думаю, котлин слишком сильно сложнее брейнфака, чтобы писать для него компилятор или даже интерпретатор следующим проектом. Тем более в одиночку

01:32пожаловаться #9

MO

Alexander Nasonov

А контрибутить в ллвм не вариант?

А зачем? Для кого-то может и вариант

01:32пожаловаться #10

T

TGG in Compiler Development

Igor 🐱 Jirkov

Я думаю, котлин слишком сильно сложнее брейнфака, чтобы писать для него компилятор или даже интерпретатор следующим проектом. Тем более в одиночку

Я для себя. К тому же я делаю для интереса, а не для решения задачи.

Kotlin: free download. Ebooks library. On-line books store on Z-Library

01:33пожаловаться #11

SS

Sergey Sverdlov in Compiler Development

TGG

А на русском нет? Я знаю иностранные языки просто для сверки, вдруг что упущу.

https://b-ok.cc/s/Kotlin

b-ok.cc

Kotlin: free download. Ebooks library. On-line books store on Z-Library | B–OK. Download books for free. Find books

Kotlin: free download. Ebooks library. On-line books store on Z-Library

01:38пожаловаться #12

T

TGG in Compiler Development

Sergey Sverdlov

https://b-ok.cc/s/Kotlin

b-ok.cc

Kotlin: free download. Ebooks library. On-line books store on Z-Library | B–OK. Download books for free. Find books

Спасибо)

02:05пожаловаться #13

МБ

polunin.ai

Она распространена на суперкомпьютерах, персональным и серверным же хватает и х86

x86 эффективнее VLIW-ов, поэтому на суперкомпьютерах тоже распространена x86, ну, или POWER, которая такая же, как x86 - суперскалярный out-of-order.

У VLIW-ов проблема: промахи по кэшам первого уровня очень сильно тормозят обработку. А в самих кэшах очень много места тратится под nop-ы в длинных словах. Не все алгоритмы можно так хорошо вектоирзовывать/конвейеризировать. Есть ещё всякие мелочи с задержками делений и умножений.

Когда память быстрая и локальная VLIW - очень хорошо себя проявляет. Но в реальности нельзя за приемлемые деньги и энергетические бюджеты сделать гигабайт быстрой локальной памяти.

Самое узкое место - память, поэтому нужно, чтобы процессор умел переживать задержки доступа к ней. Поэтому рулит out-of-order исполнение, несмотря на кучу технических недостатков.

Как-то так.

10:09пожаловаться #14

MO

Михаил Бахтерев

x86 эффективнее VLIW-ов, поэтому на суперкомпьютерах тоже распространена x86, ну, или POWER, которая такая же, как x86 - суперскалярный out-of-order.

У VLIW-ов проблема: промахи по кэшам первого уровня очень сильно тормозят обработку. А в самих кэшах очень много места тратится под nop-ы в длинных словах. Не все алгоритмы можно так хорошо вектоирзовывать/конвейеризировать. Есть ещё всякие мелочи с задержками делений и умножений.

Когда память быстрая и локальная VLIW - очень хорошо себя проявляет. Но в реальности нельзя за приемлемые деньги и энергетические бюджеты сделать гигабайт быстрой локальной памяти.

Самое узкое место - память, поэтому нужно, чтобы процессор умел переживать задержки доступа к ней. Поэтому рулит out-of-order исполнение, несмотря на кучу технических недостатков.

Как-то так.

>А в самих кэшах очень много место тратится под nop-ы в длинных словах.
что вы хотите сказать?

10:12пожаловаться #15

МБ

>А в самих кэшах очень много место тратится под nop-ы в длинных словах.
что вы хотите сказать?

На реальных задачах получается код, в котором очень много nop-ов в длинных словах (ну, пропусков операций). Я не знаю, как это на Эльбрусе называется, использую Itanium-терминологию.

10:13пожаловаться #16

MO

Михаил Бахтерев

На реальных задачах получается код, в котором очень много nop-ов в длинных словах (ну, пропусков операций). Я не знаю, как это на Эльбрусе называется, использую Itanium-терминологию.

В эльбрусе эту проблему как-то решили.

10:13пожаловаться #17

МБ

В эльбрусе эту проблему как-то решили.

Интересно. А как?

10:14пожаловаться #18

MO

Михаил Бахтерев

Интересно. А как?

Нопы часть широкой команды. За счет этого экономится место. Ну и компилятор у них крутой, поэтому на реальном коде получается эффективно разнести инструкции

10:15пожаловаться #19

МБ

Нопы часть широкой команды. За счет этого экономится место. Ну и компилятор у них крутой, поэтому на реальном коде получается эффективно разнести инструкции

Но в широкой команде всё-равно же стоит код этого nop-а, который занимает свой слот.

Про компилятор не знаю. Но когда смотрел на выставке примеры, nop-ов было много. И в исходниках очень много ручной оптимизации через intrinsic-и.