Ассерты там только на АПИ системы, если это так можно назвать. То есть например обработка фрейма должна идти не более например 15мс, это подходит под ассерт. А вот распознание объекта категории Х и получение его параметров в реальном времени по мере перемещения его по сцене - это уже КПИ тесты, так как детектирование имеет вероятностные факторы, и ассертить тут можно лишь какие то базовые вещи "сцене есть грузовик, система должна сообщить что вроде как видит грузовик с такой то вероятностью". И дальше строим графики которые показывают например вероятность существования грузовика за промежуток времени, сравниваем с результатами других моделей, смотрим изменения и тп. У нас количественно КПИ тестов больше например (без учета тестов прошивок железа и тп низкоуровневых слоев)
Ассерты там могут быть много на что, зависит от целей.
У нас, например, на одном из проектов был скрипт, который отдельно собирал наиболее частотные кейсы по каждому из сценариев и прогонял через модель именно ассертами.
Потому что это оказалось проще, чем дробить метрики по приоритетным\неприоритетным кейсам.
А красивая оценка по TP\TN\FP\FN, к сожалению, не показывет динамику (какие кейсы ты стал детектить хуже, какие лучше).