первое что лезет в головую.
достаешь, наверняка через что-то вроде response.xpath('//div/text()').get()
при нормально скорости все Ок. При повышенной нагрузке, или, при запросе с тора (насколько я слышал, он довольно легко палится) оборачиваем некоторые символы пыстыми div'ам. Не уверен, но, по моему, приведенный выше xpath пропустит такие символы.
и да, если начинаются такие шаманста, смотреть ответ в браузере - последнее дело. это только сам респонс из паука смотреть, или сохранить его.