Что меня беспокоит в разделении по кускам, что если Берт работает на контексте и работает по всему документу, то при делении на куски может оказаться, что сунутый кусок не содержит ключевых фраз в рамках всего документа ( шумовой кусок скажем так), но без окружающего контекста он же все равно будет из него извлекать ключевые фразы.