Подскажите, пожалуйста, как дотренировать embeddings для моего моих данных?
У меня safety data sheets, их довольно много и они на разных языках. Собираюсь обучать NER, но, думаю, было бы хорошо сначала дотренировать эмбеддинги на неращмеченных данных.