AL
Пытался понять как моя "нейросеть" в голове определяет важно/не важно.
NER конечно помогает
Выделяю личностей, например, считаю кол-во их упоминаний
Если личность часто упоминалась в текстах - то значит она связанна с какой-то важной новостью
Также пытался сделать с организациями (из коробки работает в natasha)
Но:
1) Полнота маленькая (не во всех новостях фигурируют личности)
2) Качество NER на сырых текстах, парсинг которых иногда барахлит, не самое лучшее
1) теперь выделить новости без личностей; посмотреть внимательно только на них, и понять - какие ещё есть признаки
2) улучшать качество парсинга ) я давно занимаюсь парсингами - качества всегда можно улучшить ) ...либо подумать, как ещё собрать словарь именованных сущностей (может быть на других текстах) :)