Вот убери разметку, что это заголовки, пусть это теперь текст. Берем скользящее окно, выбирай любое. Дальше строим модель, в зависимости от того, что например если нужно в первом окне - хорошо. Если второе окно норм, если в третьем так себе и дальше модель штрафуем по мере удаленности.
Тогда, фактически у тебя получиться, что если нужные слова в опе мира, ну и результат так себе.