хм, ну фаньцешные иероглифы типа 𭔧 (⿰寧夜) наверное можно включить, пушто они pure phonetic и не имеют смысла (хотя смотря что подразумевать под «смыслом»......)
в юникод не только иероглифы из текстов попадают, в первую очередь туда добавили символы из уже существовавших кодировок + всякие официальные штуки типа иероглифов из индексов личных имён разных регионов и всякое такое