Слушайте, для тренировки ner в spacy, если я хочу извлекать числа по смыслу, то нужно размечать словосочетания "слово + число", или можно отдельно только число?
Мне нужно, анализировать отчёты государственных школ и там много много чисел.
Одно дело разметить:
Куплено 300 тон сосисок
Или отменить только:
300
Чтобы научиться извлекать количество закупленных тон сосисок?
Если размечать нужно слово + число, то важно, сколько символов между "закуплено" и "300 тон"?
Если нет, то что делать, если число 300 встречается несколько раз, но всегда оно значит количество тон сосисок?
Точность мерю F1 метрикой.