Вчера писали (
https://t.me/dataleak/723) про то, что в открытой БД Elasticsearch нашлось около 24 млн. документов, описывающих десятки тысяч выданных в США кредитов. С грехом пополам, эту БД прикрыли, а сегодня пришла новость про обнаружение открытого репозитария Amazon S3, содержащего оригиналы этих документов. 🙈
В свободном доступе находятся 21 PDF-файл общим размером 1.3 Гб.
Среди прочего, уже обнаруженного ранее в БД, тут лежат еще и налоговые формы (W-2).
И БД, обнаруженная ранее и этот репозитарий AWS, были оставлены в открытом доступе вендором, занимающимся обработкой документов. В частности, компания OpticsML (по заказу другой компании – Ascension) тестировала на реальных данных свои решения по распознаванию текста.
Кстати, ни сайт, ни телефон OpticsML в данный момент не работают. 🙈