Телеграмм чат группы compilerdev страница 1439

Сайт не просто так называется "The Computer Language Benchmarks Game". ;)
И "делать самому" — это не решение (какой-то "Вы" может напороть ещё хуже).
Решение — делать качественные (что, насколько я помню, изучается в университетах, и есть даже более одного относящегося к делу предмета).

источник

11:41пожаловаться #9

λ

λoλdog in Compiler Development

polunin.ai

Из этого следует что человек "сам" тоже не умеет бенчмаркать

Именно

источник

11:41пожаловаться #10

M

MaxGraey in Compiler Development

Вообще то большинсто действитеьлно не умеют делать бенчмарки

источник

11:41пожаловаться #11

M

MaxGraey in Compiler Development

Просто делают ужаснейшие веши и очень поспешные выводы. Про прогрев и тем более t-критерий Стьюдента и как правильно агрегировать несколько замеров я уже вообще молчу

источник

11:43пожаловаться #12

AT

Alexander Tchitchigi... in Compiler Development

В этой связи напомню про https://soft-dev.org/pubs/html/barrett_bolz-tereick_killick_mount_tratt__virtual_machine_warmup_blows_hot_and_cold_v6/

источник

11:46пожаловаться #13

AT

Alexander Tchitchigi... in Compiler Development

Как видно, в ряде случаев даже программы на C не показывают устойчивого поведения.

источник

11:47пожаловаться #14

AT

Alexander Tchitchigi... in Compiler Development

Т.е. у нас "всё плохо" по всему стеку от процессора и выше.

источник

11:47пожаловаться #15

YS

Yaroslav Schekin in Compiler Development

Вот что самое неприятное в отношении популярных benchmarks, IMHO (прямо из https://t.me/CompilerDev/67795 , подчёркнутое):

The microbenchmarks we use are as follows: binary trees, spectralnorm, n-body, fasta, and fannkuch redux from the Computer Language Benchmarks Game (CLBG) Bagley et al. [2004]; and Richards. Readers can be forgiven for initial scepticism about this set of microbenchmarks. They are small and widely used by VM authors as optimisation targets.

Т.е. авторы соответствующих продуктов начинают "затачивать" их именно под эти benchmarks (иногда методами, которые и близко нельзя назвать честными, т.е. бесполезными (а то и вредными) почти во всех остальных случаях).

Alexander Tchitchigin in Compiler Development

В этой связи напомню про https://soft-dev.org/pubs/html/barrett_bolz-tereick_killick_mount_tratt__virtual_machine_warmup_blows_hot_and_cold_v6/

источник

11:56пожаловаться #16

AT

Alexander Tchitchigi... in Compiler Development

> Т.е. авторы соответствующих продуктов начинают "затачивать" их именно под эти benchmarks (иногда методами, которые и близко нельзя назвать честными, т.е. бесполезными (а то и вредными) почти во всех остальных случаях).

Это тоже немножко overstatement. "Авторы соответствующих продуктов" если уж и оптимизируют, то с необходимостью — относительно ограниченного набора сравнительно "простых и ограниченных" бенчмарков. В этом смысле, любой набор бенчмарков — нерепрезентативный, но репрезентативного просто не бывает, и реалистично оптимизировать можно только относительно нерепрезентативного.

В этом плане, все авторы ВМ находятся в равных условиях — они все оптимизируют "не то". Но это всё, что мы можем сделать на практике.

источник

12:02пожаловаться #17

AT

Alexander Tchitchigi... in Compiler Development

Ultimate solution, конечно — оптимизировать ВМ под свой конкретный production workload. И некоторые компании могут себе такое позволить.

источник

12:02пожаловаться #18

AT

Alexander Tchitchigi... in Compiler Development

С другой стороны, если в какой-то момент это станет "трендом" (вероятно, в силу объективной необходимости) — у нас всех появится больше интересной работы. 😃

источник

12:03пожаловаться #19

YS

Yaroslav Schekin in Compiler Development

Alexander Tchitchigin

> Т.е. авторы соответствующих продуктов начинают "затачивать" их именно под эти benchmarks (иногда методами, которые и близко нельзя назвать честными, т.е. бесполезными (а то и вредными) почти во всех остальных случаях).

Это тоже немножко overstatement. "Авторы соответствующих продуктов" если уж и оптимизируют, то с необходимостью — относительно ограниченного набора сравнительно "простых и ограниченных" бенчмарков. В этом смысле, любой набор бенчмарков — нерепрезентативный, но репрезентативного просто не бывает, и реалистично оптимизировать можно только относительно нерепрезентативного.

В этом плане, все авторы ВМ находятся в равных условиях — они все оптимизируют "не то". Но это всё, что мы можем сделать на практике.

Смотря в какой отрасли. В некоторых, где от этого зависят продажи продукта — "точат" ещё как. ;)

> В этом плане, все авторы ВМ находятся в равных условиях — они все оптимизируют "не то".

Я писал в общем, не относительно только VM.
Проблема в том, что усилия тратятся на то, что на практике мало кому нужно (это не считая "благородной" цели этих усилий). ;)

источник

12:09пожаловаться #20