При загрузке модели для интерференса его можно поменять чем то вроде
config = AutoConfig.from_pretrained('model_name', max_position_embeddings=xxx)
И отдачей этого конфига в код загрузки модели
С данной моделью не работал, но у меня был успех с моделью, которая училась на последовательность длиной X, а файнтюнилась на последовательноти длиной X/3
Перебил и заработало достаточно хорошо для моей задачи.
Про данный случай у меня сомнения, но проверить можно достаточно быстро