Один из проектов которые я давно мониторю - это Archives Unleashed [1]. Проект по созданию инструментов с открытым кодом для обеспечения доступности веб-архивов для исследователей. Они сделали несколько инструментов таких как:
- Archives Unleashed Toolkit - удобное ПО для анализа WARC файлов
- Warclight - каталог для поиска и просмотра по WARC файлам
- Archives Unleashed Cloud - удобный поиск данных в веб архивах собранных сервисом Archive-It
и ещё много обучающих материалов в формате Jupyter Notebook.
У них на днях вышел Community Report за 2017-2020 годы [2]
И, в принципе, это очень хороший пример организации доступа исследователей к открытым данным.
Сам проект делается межуниверситетской командой, с основным грантополучателем University of Waterloo, финансируется Mellon Foundation, на $462,000 в 2017 году на 36 месяцев и сейчас в июне 2020 года ещё на $800,000 и 36 месяцев. Переводя в рубли - это 11 миллионов рублей в год по первому гранту и 20 миллионов рублей в год по второму гранту.
На команду из постоянно работающих 4 человек и 7 человек вовлеченных в проект в той или иной форме.
Но главное результат, это действительно очень полезный инструментарий.
Ссылки:
[1]
https://archivesunleashed.org[2]
https://news.archivesunleashed.org/archives-unleashed-community-report-2017-2020-d997510e5b70#opendata #openaccess #digitalpreservation