и это, это вопрос общий по питону, даже больше алгоритмов.
А тут, как бы, группа конкретно по фрейморку и парсингу сайтов
так в чем проблема? Смотри сам полученный текст и ищи особенности, как выловить то или иное.
А вообще. принципиально именно питоном это сделать? ИМХО проще руками перелопатить :)