А замеры по перформансу есть? Насколько дорого обходится?
У меня пока что довольно корявая реализация, поэтому тормознее в 8 раз. Там много чего можно оптимизировать, на один источник тратится в среднем 0,7-0,8 мс. Что в принципе терпимо учитывая что на рендер очередной порции семплов выделяется примерно 100 мс