Привет! Мне нужно сделать NER, предполагаю использовать классификатор на pyTorch. И вопрос следующий: доки у меня уже в формате spaCy, в них уже есть BERT-эмбеддинги, однако для многотокенных entity вектор является результатом mean-пуллинга. Хочу поинтересоваться, не является ли это чем-то плохим для NER'a, или всё-таки лучше использовать потокенную разметку с BIO-like тегами?