А как провести границу между разработчиком, считающим себя архитектором, и архитектором, который хорош в разработке? КМК, очень субъективно.
По теме: тестовые задачки нужны в случае найма джуна: чтобы отсечь совсем нулевой уровент, а также как отправной пункт к дальнейшей беседе. Всё равно в большинстве случае софт-скиллы важнее хард-скиллов.
Практика единственный критерий.
Джунов слишком много и нужен отсев. А старших (типа архитекторов, ведущих) слишком мало, поэтому тоже нужно понимание, подходит ли тебе человек, на ключевую роль. Или же его принципы построения решений тебе в корне не стыкуются с текущими/твоими подходами.