Я думаю для нейросети это и будет основной способ детекта. Ведь даже "ученый опубликовал новую статью" *краткое описание* - это тоже новость... Хотя глубокий анализ текста скорее всего скажет что это научная статья а не новость.
Я что-то не понял, как у Hip Hyena языки определяются за 8.6 сек, а новости - за 5.8 сек? 1. На определение языка забивает? 2. Ошибка в тестировании? 3. Кеширует в файл каждый этап (тогда надо запускать на различных датасетах каждый из этапов)?
Я что-то не понял, как у Hip Hyena языки определяются за 8.6 сек, а новости - за 5.8 сек? 1. На определение языка забивает? 2. Ошибка в тестировании? 3. Кеширует в файл каждый этап (тогда надо запускать на различных датасетах каждый из этапов)?