ну у них вроде вот этот бенчмарк сет открыт, так что в общем ссылки и вот это вроде наверное есть, там основные претензии обычно что меряется всё с кондочка и толку от этого, не густо
что достоверность неизвестна, и доверительные интервалы.
Ты фигню говоришь. Цифра есть цифра. Хочешь интервалы - сделай ансамбль и посчитай. Но это в данном случае херней заниматься. Там разница порядка 10% и это доаольно много что бы вообще начинать думать