Дан простой текстовый файл с IPv4 адресами. Одна строка – один адрес.
Файл в размере не ограничен и может занимать десятки и сотни гигабайт.
Необходимо посчитать количество уникальных адресов в этом файле, затратив как можно меньше памяти и времени. Существует "наивный" алгоритм решения данной задачи (читаем строка за строкой, кладем строки в HashSet), желательно чтобы ваша реализация была лучше этого простого, наивного алгоритма.
Привет! А нельзя изначально взять сортированный лист всех возможных адресов, переведнных в int. От 1000000000 до 255255255255. Потом, когда ты читаешь nextLine ты каким-нибудь бинарным поиском ищешь совпадение и удаляешь из листа, если нашел. Потом сравниваешь изначальную длину и новую, получаешь сколько уникальных?