Нет, квантизация тут ни причем, капсулы - это такая довольно новая архитектура нейронных сетей, которая позволяет "учесть" всякие внутренние симметрии. Было интересно попробовать, но я не считаю что обязательно их использовать. Точно ясно что GPT не содержит энкодера и это проблема для решения задач классификации обычным способом как с Бертом. Конечно, эмбеддинги GPT много полезного содержат, но использовать эти фичи не так просто