Так наверное лучше - нейросеть в этой эадаче явный перебор.. Да и yargy тоже наверное - данные в чеках неплохо структурированы проще регэкспами сдернуть. ..
но мой вопрос звучит именно так - "а если бы я захотел с помощью сетки разбивать на токены, то какой мне надо тренить выходной результат". И ответ - BIO теги.