Можно подойти к вопросу как то статистически, опираясь на то, как пишут сайты. Например, контент в тегах каких нибудь, с атрибутами и классами и на этой основе написать свой парсер. Но это такая себе работенка ))))
ага. я так и собираюсь. я прошу только идейки селекторов накидать. вот просто для примера у меня есть несколько селекторов по которым я определяю код на странице и запрещаю браузеру его переводить const ALL_SELECTORS_CODEBLOCKS = ['pre', 'figure', '.gist', '.highlight']