Если ты про момент до запроса, и из айди у тебя формируется url, тогда лучше там отсеять. Если же ты про калбэк и формирование итема, тогда все же лучше в пайплайне, в калбэке выиграшь скорости небольшой, но появится смешанная ответственность. Плюс пайплайн сможешь потом в других проектах использовать
хм, так разве не такой флоу как ниже?
пропустим этапы с engine, перейдём к тому моменту, когда ответ попал в паука.
ответ попал в паука -> переход по колбэкам -> yield item -> бросаем этот item в pipeline'ы -> ...