Разметка данных это условно эксель-табличка с колонками (id, text, label), сохранённая как текстовый файл
Потом нейросетка долго-долго жужжит видеокартами гоняя через себя тексты и метки и у нас новый бинарник, который, возможно, умеет делать предсказания меток по текстам, что не видела ранее, лучше чем до этого