Открытые данные - это не всегда государственные данные. Часто и чаще это данные собранные из открытых источников или же данные как результат научной деятельности. Далее подборка источников данных которые не являются государственными:
-
re3data.org - реестр порталов данных научных репозиториев, более 2000 репозиториев в реестре
-
dataverse.harvard.edu - один из крупнейших репозиториев данных в мире, в Гарварде. Более 81 тысячи наборов данных
-
data.occrp.org - банк данных расследователей OCCRP. 194 миллиона документов включая файлы документов, наборы данных, утечки писем и многое другое.
-
offshoreleaks.icij.org - базы утечек данных об оффшорах от ICIJ
-
opendata.cern.ch - открытые данные адронного коллайдера и других проектов CERN. Огромного объёма, но применимы только физиками.
-
dumps.wikimedia.org - дампы проектов фонда Викимедия, таких как Wikipedia, Wiktionary, Wikibooks, Wikidata и другие
-
archive.org - крупнейший в мире архив наборов данных: веб-страниц, баз данных, результатов работы веб-краулеров, архивы FTP серверов и многое другое
-
registry.opendata.aws - большие объёмы данных доступных через Amazon AWS. Много данных реального огромного объёма (несколько петабайт)
-
scans.io - совместный проект нескольких компаний и групп по кибербезопасности выкладывающих результаты сканирования сетей
Это не исчерпывающий список и огромные объёмы данных публикуются без участия государств/правительств или же доступны исследователям.
#opendata #data