Да большинство так и делает. Проблема только в том, что пайплайн обучения и пайплайн инференса превращается в две разные сущности. Их надо поддерживать, синкать. Можно кастомные эстиматоры для spark ml написать, но тоже поддерживать придется. А хочется ведь счастья и лениться )