Можно нейронку построить, а датасет пробовать собирать как раз через поиск сокращённых слов и вариантов слов, нуждающихся в сокращении. Но много слов тогда найдется неправильных: для рис, в, г, см -- наиболее популярные слова будут наверное рисовать, вы, где, смотретб, или что-то подобное. То есть только одно слово совпадает. А для акронимов часто расшифровки есть только в словаре.