хорошо когда есть один язык, который условно "все" понимают
это правда
но это же не отменяет того, что вы примерно в 6 тысяч раз уменьшаете языковое разнообразие и, значит, объект лингвистических и нлпшных штудий, если занимаетесь только английском
если вы хотите, чтобы модельки действительно имели хорошую языковую обобщающую способность, то только английский -- это дикий оверфит