расскажи пожалуйста, как решил. И для чего это нужно?
какие варики смотрел?
это дико интересно звучит
Есть много старых данных из кучи систем, наптсаных в разное время, которые бекапились методом дампов бд в SQL. И как вишенка на торте в бд данные затирались. Типа заказ выполнен - долой его из бд. Причем часть приложений нормальная была, без таких глупостей, а часть нет. Все дампы скинуты в один котелок, в котором иногда нужно найти к примеру едрпу контрагента и понять мы вообще имели с ним дела в последние лет 20 или нет. В каком из подразделений, если да - то что делали. Как вишенка на торте часть документов это просто вордовский файлы с актами. Или ещё хуже акты накиданые в Экселе. Вообщем болото из кучи не структурированных данных.
Пока смотрим в сторону еластика и приложения для индексации которое бы делало doc=>txt