бля ну я не оч разбираюсь в этой теме, только косвенно. но скорее всего нужно делать так:
1. разбивать входные данные голоса на блоки (уже после оцифровки его, сжатий и прочего).
2. шифровать блок голоса.
3. отправлять блок по rtp.
4. принимать блок.
5. дешифровывать.
то есть нужно вклиниться между asterisk и rtp скорее всего. почитай что пишет asterisk. это реализовывается как плагин, скорее всего.