в моём понимании: делается скриншот opencv возвращает все прямоугольники с текстом затем мы смотрим у каждого прямоугольника верхнюю левую точку и расшифровываем нужный нам прямоугольник
логика и так понятна. мне бы поконкретнее. пример.
я не работал с autoit. но вам и не придётся же с ним работать. вы импортируете функции из библиотеки и работаете с ними. функции можно найти в гугле и примеры там же. на ютубе я ещё глянул бы