Я бы только чуть осторожнее использовал тематические модели вместе с tf idf, там есть некоторая проблема с тем, что tf idf неплохо показывает дискриминативные слова для документов, но если важна относительная частота тех или иных слов (напр., геймплей будет встречаться часто, но не везде), то tf idf может создать проблемы