Немного тезисов и рефлексии о том как устроено присутствие государства в интернете сейчас. Всё это по результатам анализа 7500 госсайтов/доменов, всё ещё неполный, но списки большего размера мне неизвестны.
1. Большая часть госсайтов не используют системы CDN (content delivery networks).
2. Используются лишь следующие CDN сервисы: Лаборатория Касперского (МВД), Ngenix (ФНС России) , QRator (Минпром). Больше всего доменов за сервисом Лаборатории Касперского, почти все сайты МВД и несколько сайтов других органов власти
3. В целом около 1900 доменов хостится внутри органов власти и около 1558 на разного вида хостингах и
около 2887 хостится в Ростелекоме за пределами той части Ростелекома которая относится к электронному правительству - они учитываются как хостинг внутри органов власти.
4. Общий тренд последних лет 5 - это консолидация территориальных управлений на сайте органа власти или консалидация их сайтов на одной платформе. Такие платформы ГАС Правосудие и ГАС Выборы включают сотни типовых сайтов субъектов федерации и они существуют давно. А МВД с одной стороны все сайты ГИБДД в субъектах свели в разделы на сайте
gibdd.ru, а с другой массово плодят сайты поддоменами в
mvd.ru (
мвд.рф) для каждого их подразделения, включая все медчасти и ОВД по всем районам и городам. Более 900 сайтов/доменов и число постепенно нарастает
5. Количество создаваемых новых сайтов ежегодно измеряется сотнями. Где-то создают органы власти, их территориальные управления, новые порталы, просветительские проекты. Но чаще - это мероприятия.
6. Единственный поисковик контактов/сайтов органов власти - это ГАС Правосудие (
sudrf.ru). Даже у МВД с их 900 сайтами нет поисковика по ним всем или единого перечня.
7. Поиск в гугле или яндексе по домену командой "site:
gov.ru" охватывает лишь 904 домена из 7500 потому что слишком многие органы власти, учреждения, мероприятия и тд. используют другие доменные зоны. Корневых доменов для госструктур не менее 150: это
мвд.рф,
mid.ru,
sudrf.ru,
mil.ru,
vkks.ru,
mcx.ru и ещё много других. Большое множество других.
8. За исключением больших платформ для сайтов ГАС Правосудие, ГАС Выборы, системы сайтов МВД и тд. разброс технологий, средств разработки, CMS систем для госсайтов очень большой. Это всегда было и остаётся проблемой на федеральном уровне. Если создавать единую платформу на базе
www.gov.ru, к примеру, то придётся решать весьма сложную задачу миграции контента из тысяч сайтов. Это реально расходы в миллиарды рублей и риски потери данных при переносе
9. Ни один орган власти в России не ведёт цифровую архивацию его материалов. Исключение - это Банк России, сохраняющий архивные сайты ФСФР ещё с начала 2000-х годов. Во всех остальных случаях системно архивные материалы/ресурсы/старые версии сайтов не сохраняются. Среднее время жизни старой версии сайта госоргана после того как запускают новую - примерно 1.5 года. В некоторых случаях, как МВД ещё в начале запуска их сайта
mvd.ru и когда они поглотили внутрь себя ФМС, срок жизни старых сайтов составлял 0 дней. То есть их моментально уничтожали сразу с появление новой версии, даже если сведения не сохранены и не перенесены.
10. Многие сайты, особенно информационных систем, но часто и сайты ФОИВов невозможно полностью заархивировать. Где они работают на Ajax, где-то некоторый контент доступен только через POST-формы, где-то автоматически срабатывают роботы блокирующие поисковых роботов. В целом даже внешняя архивация затруднена и требует написания парсеров.
11. Опасная тенденция - ограничения на доступ к данным через принудительную авторизацию через ЕСИА. Пример - ЕГИС УОИТ
https://uoit.fsrpn.ru/ у Росприроднадзора. Это означает что с данными невозможно работать в режиме система-система, принципы открытости не соблюдаются, поисковые системы не индексируют, но система при этом "типо открыта", можно авторизоваться и посмотреть. Очень важно чтобы эта тенденция не стала массовой. Доступ к открытым данным не должен быть через ЕСИА, ни в коем случае.