питон в самый раз! это будет сразу геокодинг или сначала нормализация? так понимаю неточные адреса придется вручную разгребать. надеюсь лишь, что алгоритм пережует большинство адресов. про регистр пока без понятия
Если в качестве источника для вдохновления подойдёт код на тайпскипте, могу поделиться кое-какими наработками. Есть разбивалка адреса на токены с убиранием мусора и нормализацией некоторых токенов (ул. -> улица).