Size: a a a

2020 March 28
Ivan Begtin
Сегодня Инфокультуре исполняется 8 лет! 🎉

Мы рады, что сообщество активистов открытых данных в нашей стране растет с каждым годом. Благодарим всех, кто участвует в наших проектах и помогает продвигать концепцию открытости.

В этом году мы отмечаем день рождения в эпоху неопределенности, черных лебедей, самоизоляции и онлайна. Мы искренне убеждены, что свободный обмен знаниями и данными помогает всем нам эффективнее решать общественные проблемы.  

📚 Самый ценный вклад, который мы можем сейчас внести — это дать вам возможность узнавать новое, вдохновляться идеями и исследованиями других, чтобы совершенствовать собственные навыки. Хотим поделиться с вами накопленными знаниями и предлагаем вам посмотреть на происходящее с точки зрения данных. Собрали для вас тематическую подборку видео наших лекций:

- «COVID-19: Как смоделировать распространение коронавируса?» — Дмитрий Сергеев, Senior Data Scientist ŌURA, руководитель курса по машинному обучению OTUS: https://bit.ly/2Un6dcS
- «Раскрытие данных о заболеваниях россиян» — Дада Линделл, дата-журналист РБК: https://bit.ly/39tRQaJ
- «Влияние отключения интернета на экономику регионов» — Михаил Климарев, исполнительный директор Общества Защиты Интернета: https://bit.ly/2UmCiBo
- «Комфорт и безопасность в городе: что важно для жителей и что мы можем измерить при помощи данных?» — Юлия Апухтина, главный редактор Интернет-журнала «Другой город»: https://bit.ly/33TgwbI
- «Чему нас научили данные о получателях гуманитарной помощи» — Дарья Алексеева, директор фонда «Второе дыхание»: https://bit.ly/33Y2jKz

Внимание: к описанию видеозаписей прилагаются презентации.

Архив: https://www.youtube.com/infoculture.

🍩 Вы можете нас поздравить и выразить поддержку нашей деятельности с помощью доната: https://www.infoculture.ru/donation.
YouTube
COVID-19: Как смоделировать распространение коронавируса? Воркшоп по анализу данных
Используя различные источники открытых данных, мы покажем, как можно смоделировать распространение болезни по миру.

Как анализ графов может показать, где наиболее вероятно появятся новые очаги заражения? Что такое иммунизация сети и насколько эффективно закрытие границ?
Как использовать открытые данные и SIR-модель (Susceptible-Infectious-Removed) для оценки опасности эпидемии?

Преподаватель:
Дмитрий Сергеев, Senior Data Scientist ŌURA, Руководитель курса по машинному обучению OTUS.

Код: https://github.com/DmitrySerg/COVID-19
Гифка: https://nbviewer.jupyter.org/github/DmitrySerg/COVID-19/blob/master/pictures/COVID_paths.gif

День открытых данных в Москве https://opendataday.ru/msk 6-7 марта 2020 года

Подписывайтесь на нас в соц. сетях!
Facebook https://www.facebook.com/InformationCulture
Вконтакте https://vk.com/infoculture
Рассылка Инфокультуры https://clck.ru/FNxm5

Поддержать нас https://www.infoculture.ru/donation/
источник
Ivan Begtin
Наше исследование по открытости ГИСов мы начали сильно раньше коронавируса и многое в нём не учли. Но самое главное что мы не отразили и самое главное что актуально сейчас - это доступность статистики смертности по России. Не отразили поскольку эта система никогда не предполагала массового пользователя,

ЕГР ЗАГС не публикует статистику с середины 2018 года http://zags.nalog.ru/statistics/ да и тогда она публиковалась исключительно в виде 3-х картинок. Что очень удивительно для всех систем ФНС где качественная ведомственная статистика ведётся много лет.

Как анализировать статистику смертности, если эти сведения официально не публикуются?

Что делать с тем что статистика смертности по причинам смерти не публикуется?

#opendata #data
источник
2020 March 31
Ivan Begtin
К сожалению (или к счастью для кого-то?) разработчики приложения социального мониторинга в Москве [1] более чем безграмотны. В канале @itsorm сразу много публикаций о том как безграмотно приложение подготовлено, использует HTTP вместо HTTPS и не только.

Лично я лишь удивляюсь почему в России тем что должна делать федеральная власть занимаются московские власти.

Ссылки:
[1] https://play.google.com/store/apps/details?id=com.askgps.personaltrackerround

#privacy #coronavirus
источник
Ivan Begtin
Видимо, хост, на который отправляет данные приложение для слежки за жителями Москвы
источник
Ivan Begtin
Австралийское государственное приложение Coronavirus Australia [1] появилось в Google Play 29 марта [2] и у него уже 580 оценок и 3 звезды.
Российское государственное приложение Мэрии Москвы [3] появилось 25 марта [4] и к нему уже 631 отзыв и оценка в 1 звезду.

Пользователи активно минусуют попытки государства к внедрению всеобщего мониторинга. Но я хочу обратить внимание на другое. Московское приложение, помимо того что сделано "тяп ляп" [5] ещё и сливает статистику в Google Firebase [6] поскольку использует Google Firebase Analytics [7] в своей работе.

Если кто-то хочет задаться вопросом можно ли разрабатывать приложения для Android не сливая статистику и аналитику в Google, то ответ - да, можно. Почему это не было сделано? А вот это и есть важный вопрос, который, я уверен, журналисты найдут время и спросить ДИТ Москвы.

Ссылки:
[1] https://play.google.com/store/apps/details?id=au.gov.health.covid19
[2] https://www.abc.net.au/news/2020-03-29/federal-government-launches-coronavirus-australia-app/12100680
[3] https://play.google.com/store/apps/details?id=com.askgps.personaltrackerround&showAllReviews=true
[4] https://t.me/antidigital/2439
[5] https://t.me/begtin/1841
[6] https://reports.exodus-privacy.eu.org/en/reports/122620/
[7] https://firebase.google.com/

#privacy #coronavirus #moscow #mobile
источник
Ivan Begtin
А вот и ещё подробности уже на основе анализа приложения.
источник
Ivan Begtin
Чтобы вы понимали: персональные данные россиян (фотографии!) из приложения ДИТа мэрии Москвы передаются на серверы в Эстонии (страна НАТО, на секундочку) и возвращаются обратно в виде их анализа.
Интересно, оштрафует ли мэрию Москвы Роскомнадзор?
Или возбудит уголовное дело Следственный Комитет?

То есть у условного ЦРУ есть вообще все рычаги для сбора массива данных о жителях Москвы. И все это богатство подарили западным спецслужбам ДИТ и Собянин.
источник
2020 April 01
Ivan Begtin
Не в моих правилах частить с упоминанием какой-то темы, но тут какая то рукотворная катастрофа созданная руками: ДИТ Москвы -> ГБУ Информационный город -> компания "Гаспар" и итоговый продукт в виде мобильного приложения "Социальный мониторинг".

Я постараюсь уже завтра-послезавтра облечь это в текст в "большой форме".

#privacy
источник
Ivan Begtin
Промежуточные итоги изучения приложения для слежки за жителями Москвы:

— Приложение получает доступ ко всей информации на телефоне: GPS, камера, местоположение, возможность звонить, просмотр любых данных, доступ к любым настройкам.

— Приложение передаёт собранную информацию на серверы мэрии в открытом виде без какого-либо шифрования. Это провал.

— Для распознавания лиц, приложение использует эстонский сервис identix.one — то есть, передаёт фотографии в эстонскую юрисдикцию и на серверы, расположенные в Германии. Обе страны входят в НАТО.

— Разработкой приложения занимается компания «Гаскар», подрядчик «Инфогорода».

— В QR-кодах зашифрованы MAC и IMEI (индивидуальные идентификаторы) устройства.

— На приложение было потрачено 180 млн рублей. Судя по его качеству, украдено было 99% бюджета.

Это полнейший провал и позорище. ДИТ Москвы должен быть разогнан палками за такое.
источник
Ivan Begtin
Жанр моего канала в телеграм не предполагает сарказма, даже когда очень хочется, поэтому просто процитирую реакцию из канала "Координация профанации".  То что ДИТ Москвы оперативно откатили попытку внедрения социального мониторинга - это хорошо, но вот в том что это было тестовое приложение поверить очень сложно. Хорошая мина при плохой игре, не более того.
источник
Ivan Begtin
Рубрика "Циничная отмазка"
Циникс послушал "Эхо Москвы", на котором по телефону директор ДИТа Эдуард Лысенко как явно назначенный крайний оправдывался (это звучало именно так)  за вчерашний косяк с приложением "Социальный мониторинг". По пунктам:
1. Приложение предназначено только для больных короной, которые выбрали способ лечения на дому, и это приложение в некоем смысле представляет собой вариант электронного браслета от ФСИН (это циничная интерпретация Циникса, но смысл передан верно).
2. Перед пользованием приложением больные будут подписывать информированное согласие (видимо, электронной подписью, сгенерированной теми же рукожопыми погромистами).
3. Вчера это было пробное тестирование, чтобы собрать обратную связь и улучшить приложение. Собрали... Приложения в открытом доступе уже нет. Всем спасибо.
4. Тем больным, у кого нет смартфонов, ДИТ будет их выдавать вместе с установленным приложением. Когда выздоровеют, больные обязаны будут вернуть смартфон ДИТу.
5. За границу ничего не передается. Сервера Айдентикса не используются, используются только алгоритмы (ага, конечно!). Все остается на серверах ДИТа (тех же, очевидно, где хранилось электронное голосование).
Про QR-коды для всех сейчас будет
источник
Ivan Begtin
На сайте covid19faq.ru Инфокультура запускает базу знаний по COVID-19. Это пока небольшая и постоянно пополняемая база знаний по коронавирусу COVID-19 созданная в форме вопросов и ответов.

В базе знаний собраны:
- общие сведения о коноравирусе
- симптомы, тесты и лечение
- как минимизировать риск заражения
и многое другое.

Все материалы взяты _исключительно_ из официальных источников, снабжены ссылки на первоисточник(-и) и проходят внутреннюю процедуру проверки. Подробнее в разделе "О проекте" [1].

А также, в виду специфики Инфокультуры про работу с данными, есть специальный раздел "Открытые данные и исследования" [2] в котором собираются вопросы и даются ответы о том где найти открытые данные о COVID-19, как помочь учёным в исследованиях и какие исследования проводятся и так далее.

Проект пока на самой ранней стадии, ещё нигде официально не анонсировался. Если у Вас есть идеи/предложения/замечания, то присылайте нам на covid19@infoculture.ru или через контактную форму на сайте.

Если Вы представляете медицинское учреждение или орган власти по регулированию или контролю здравоохранения, или частную медицинскую организацию со значимым присутствием в России, то мы готовы к партнёрству в развитии и наполнении проекта. Проект с самого начала создавался как партнёрский.

Ссылки:
[1] https://covid19faq.ru/l/ru/article/l0qfrfqq1i-about
[2] https://covid19faq.ru/l/ru/category/5tlrc091fo-data

#covid19 #coronavirus #opendata
источник
2020 April 05
Ivan Begtin
Как обеспечить доверие граждан в период кризиса, такого как пандемия COVID-19?

Для начала обеспечить максимальную доступность информации и гарантировать защиту прав граждан на всё время кризиса и после него.

Это не так сложно как могло бы показаться:
1. Необходимо раскрывать максимально, возможно, детально сведения по смертности граждан на ежедневной основе. Максимально подробно - это статистика по причинам смерти и по возрастным группам. У государства есть возможность это делать на федеральном уровне на основе данных из ЕГР ЗАГС [1] и на уровне субъектов федерации решением губернатора.

2. Раскрытие информации о реальном распространении болезни в форматах открытых данных. Большинство журналистов вполне владеют Excel, многие вполне умеют открывать файлы CSV и работать с гораздо более сложными форматами данных. Официальное раскрытие данных в машиночитаемом виде, на ежедневной основе, необходимо для успешного информирования граждан. То что сейчас все чаще цитируют зарубежные агргегаторы сведений о коронавирусе, а не российские официальные источники, это одно из следствий недостаточной открытости данных в России

3. У всех вводимых мер "социального мониторинга" должны быть опубликованы обоснования и, самое главное, четко обозначенный и нормативно-зафиксированный срок вывода систем из эксплуатации. Если этот срок не указан _явным образом_ в указе губернатора или решении федерального органа власти, это означает что данные системы останутся и после кризиса и их эксплуатация может привести и, неизбежно, приведёт к злоупотреблению властью.

4. При введении систем социального мониторинга, в обязательном порядке предоставлять исчерпывающие сведения о том какие данные, как именно, кем именно собираются, как они используются и что будет с ними по окончании пандемии.

Ссылки:
[1] http://zags.nalog.ru

#opendata #privacy #transparency
источник
Ivan Begtin
Лишнее подтверждение то что Москва не Россия в неприятной сегодняшней находке.

Все субъекты федерации передают в ФСО России нормативно-правовые документы для их официального опубликования. Эти документы общедоступны на сайте официального опубликования правовых документов [1].

Там есть (должны быть) документы всех федеральных органов власти и субъектов федерации, за исключением Москвы. Нормативно-правовые документ Москвы там отсутствуют как явление.

Косяк ли это pravo.gov.ru или этой власти города не отдают им свои НПА - это очень интересный вопрос на который у меня ответа нет.

А вот в реестр Минюста НПА Москвы есть. Интересно хоть кто-то когда-либо делал кросс сопоставления официальных реестров НПА?

Ссылки:
[1] http://publication.pravo.gov.ru/

#opendata #laws #gov
источник
Ivan Begtin
Скриншот поиска по органам власти на Publication.pravo.gov.ru
источник
2020 April 06
Ivan Begtin
Всё начинается безобидно, с реестра "социально-значимых интернет ресурсов" опубликованных Минкомсвязи [1].
А закончится фильтрацией Рунета по "белому списку".

В списке нет пары десятков тысяч сайтов органов власти на федеральном и региональном уровне, сайтов муниципальных образований и ещё много чего.

Ну да, какая такая социальность. Слов нет

Ссылки:
[1] https://digital.gov.ru/uploaded/files/perechen-k-prikazu-148.pdf

#opengov #runet
источник
2020 April 09
Ivan Begtin
В Пакистане запустили панель с визуализацией данных [1] и возможностью их выгрузить с детализацией до страны и отдельных штатов.

Вся визуализация выполнена в Google Data Studio, можно смотреть ретроспективные данные и выгружать их в форматах CSV и XLSX.

Google, также, начали публиковать данные в из Google Trends по статистике поиска по коронавирусу по странам [2]

Эти данные и другие материалы собраны в проекте covid19faq.ru, в разделе "Открытые данные" [3].

Если знаете какие-либо полезные источники данных, присылайте и их, и вопросы которые возникают и на которые пока нет ответов.

Ссылки:
[1] http://covid.gov.pk/stats/pakistan
[2] https://googletrends.github.io/data/
[3] https://covid19faq.ru/l/ru/article/f3sw02fiup-data

#opendata #covid19 #coronavirus
источник
Ivan Begtin
Визуализация данных и выгрузка в статистике Пакистана http://covid.gov.pk/stats/pakistan
источник
2020 April 10
Ivan Begtin
Правительство Нового Южного Уэльса, штата Австралии, публикует актуальные данные по заболеванию COVID-19 на своём портале открытых данных [1] и сразу появились общественные проекты по визуализации данных, например, в разрезе районов [2].

Активисты извлекли данные о мобильности граждан [3] из Google Mobility Reports, отчётов компании Google которые компания выложила временно и в PDF форматах [4]. Всё ещё остаются вопросы почему компании такие как Google и умеющие работать с данными, тем не менее отдают вместо этого PDF файлы, впрочем вопросы эти риторические.

База выданных в Великобритании грантов для противодействия COVID-19 опубликована [5] в проекте 360 Giving, агрегирующем грантовую информацию на основе разработанного ими стандарта.

Портал данных, визуализации и каталог дашбордов [6] от UN Stats, статистического подразделения ООН.

Все ссылки на базы данных по COVID-19 команда Инфокультуры собирает на портале covid19faq.ru, в разделе "Открытые данные". Если Вы знаете официальные ресурсы, в особенности, раскрывающие данные по России, пишите нам, интегрируем в общий реестр.

Ссылки:
[1] https://data.nsw.gov.au/nsw-covid-19-data
[2] https://covid19nsw.ethan.link/
[3] https://github.com/vitorbaptista/google-covid19-mobility-reports
[4] https://www.google.com/covid19/mobility/
[5] https://covidtracker.threesixtygiving.org/
[6] https://covid-19-data.unstatshub.org/

#opendata #opengov #covid19
источник
Ivan Begtin
Случилось чудо (с) Сбербанк вернул раздел "Открытые данные" на свой сайт [1].
Новость несомненно хорошая, но, раздел то они вернули, а данные там в последний раз обновлялись за январь 2019 года. А ведь вот сейчас как никогда была бы интересна статистика потребления и вообще статистика которую Сбербанк публиковал.

Может они всё же догадаются не только раздел вернуть, но и данные обновить?

Ссылки:
[1] https://www.sberbank.com/ru/analytics/opendata

#opendata #sberbank
источник