Интересный стрим Татьяны Ландо
https://youtu.be/ny3VDGNdlcY?t=111 про лингвистику, Гугл, их чат-бот ассистент и русский язык.
1. Они не используют логи чат-бота, чтобы улучшать ассистент. Чтобы лучше парсить фразы типа "поставь будильник на семь" не смотрят в логи как пользователи пытаются это сделать, а придумывают что-то из головы + как все остальные собирают из открытых источников. По-моему это скорее печально. Интересно как в Алисе,
@cointegrated есть что-то публичное на тему?
2. У чат-ботов есть бесполезная часть про болталки и полезная про решение задач (тот же будильник). Сейчас отличный прогресс по болталкам, вспоминаем GPT, и непонятно что делать с решением задач. Похоже, Гугл сейчас как все строит решения на правилах, думает как бы сделать что-то unsupervised как с болталкой