Я тут вообще развиваю свою реализацию топик модель на на графах. Вот через питон отказалось несколько муторно. В принципе в R уже неплохо должно быть со стеммингом и лемматизацией русского языка.
В Питоне, несмотря на целый вагон пакетов, в некоторых случаях нужно нет. Вот тебе и многообразие :(