Помогите) Для nlp сетки нужно создать мешок слов, который должен содержать лишь СЛОВА. До сего момента я просто превращал датасет в список, удалял весь мусор(символы, ссылки и т.д.) и вот с этим уже работал, однако после удаления точек и некоторых стоп-слов нейронка не может отличить один пример от другого(одно предложение от другого). Как с этим можно бороться?