А ещё, когда эта заметка писалась, в расте по умолчанию использовался аллокатор памяти jemalloc, взамен системного. Это сверхмодерновый аллокатор, который лучше с фрагментацией работает на многопоточных системах, это тоже могло давать небольшой прирост производительности в их задаче
Сейчас по умолчанию таки сделали использовать стандартный аллокатор в угоду совместимости с несколькими редкостными платформами. Но всегда можно включить jemalloc