Привет. Решаю задачу Intent detection для open domain question answering.
Требуется определить unknown intent по низкому скору вероятного интента (или любым другим факторам).
Проблема в том, что этот скор получается высоким, больше 0.8.
По архитектуре сетки: Navec + BiLSTM + Attention + CRF(если нужен slot filling).
Пробовала использовать triplet loss, large margin cosine loss, local outlier factor, увеличивать кол-во слоёв/ attention, последние статьи на arxiv пробовала.
Если использовать bert, то в целом качество устраивает, но нужна сетка полегче.
Подскажите, пожалуйста, что ещё можно попробовать или в какую сторону двигаться.