Вот что самое неприятное в отношении популярных benchmarks, IMHO (прямо из
https://t.me/CompilerDev/67795 , подчёркнутое):
The microbenchmarks we use are as follows: binary trees, spectralnorm, n-body, fasta, and fannkuch redux from the Computer Language Benchmarks Game (CLBG) Bagley et al. [2004]; and Richards. Readers can be forgiven for initial scepticism about this set of microbenchmarks. They are small and widely used by VM authors as optimisation targets.
Т.е. авторы соответствующих продуктов начинают "затачивать" их именно под эти benchmarks (иногда методами, которые и близко нельзя назвать честными, т.е. бесполезными (а то и вредными) почти во всех остальных случаях).