Size: a a a

Чат к каналу @begtin

2020 August 21

VK

Vladislav Kazartsev in Чат к каналу @begtin
Ivan Begtin
В принципе алгоритм действий такой:
1. Поискать в unro.minjust.ru
2. Если организация есть, а отчета нет:
2.1. Запросить у Минюста через форму на unro.minjust.ru
2.2. Найти контакты организации и попросить их прислать отчёт
2.3. Договориться со СМИ и сделать запрос в Минюст и НКО от СМИ (по закону о СМИ, а не по 8-ФЗ или 59-ФЗ)
3. Если ответы неудовлетворительные.
3.1. Написать в Генеральную прокуратуру в управление общего надзора о факте несоблюдения федерального законодательства НКО и халатности в Минюсте
3.2. Написать Президенту через letters.kremlin.ru о том что есть несознательные НКО в стране
3.3. Написать в федеральное СМИ колонку о том как в стране хорошо, но есть отдельные несознательные НКО
3.4. Если это "прогосударственное НКО", написать оппозиционным политикам и блоггерам
3.5. Если это "оппозиционное НКО", написать в газету Известия, телеканал Царьград, а теперь, наверное, и в Ведомости можно
3.6. Если по НКО есть дополнительные сведения, например, наблюдательный совет или состав правления и НКО значимая (включает лиц для которых критична потеря репутации), то написать письмо членам наб. совета с вопросом, примерно, "А где отчет?"
—-
Я пропустил какие-то ещё менее существенные пункты, но в целом всё упирается в упоротость/упрямство интересующегося
симптоматично, что обращение в суд даже не упоминается
источник

AS

Al Sem in Чат к каналу @begtin
Ivan Begtin
В принципе алгоритм действий такой:
1. Поискать в unro.minjust.ru
2. Если организация есть, а отчета нет:
2.1. Запросить у Минюста через форму на unro.minjust.ru
2.2. Найти контакты организации и попросить их прислать отчёт
2.3. Договориться со СМИ и сделать запрос в Минюст и НКО от СМИ (по закону о СМИ, а не по 8-ФЗ или 59-ФЗ)
3. Если ответы неудовлетворительные.
3.1. Написать в Генеральную прокуратуру в управление общего надзора о факте несоблюдения федерального законодательства НКО и халатности в Минюсте
3.2. Написать Президенту через letters.kremlin.ru о том что есть несознательные НКО в стране
3.3. Написать в федеральное СМИ колонку о том как в стране хорошо, но есть отдельные несознательные НКО
3.4. Если это "прогосударственное НКО", написать оппозиционным политикам и блоггерам
3.5. Если это "оппозиционное НКО", написать в газету Известия, телеканал Царьград, а теперь, наверное, и в Ведомости можно
3.6. Если по НКО есть дополнительные сведения, например, наблюдательный совет или состав правления и НКО значимая (включает лиц для которых критична потеря репутации), то написать письмо членам наб. совета с вопросом, примерно, "А где отчет?"
—-
Я пропустил какие-то ещё менее существенные пункты, но в целом всё упирается в упоротость/упрямство интересующегося
Спасибо огромное!
источник
2020 August 22

ГМ

Григорий Машанов... in Чат к каналу @begtin
Vladislav Kazartsev
симптоматично, что обращение в суд даже не упоминается
Это муторно
источник

ГМ

Григорий Машанов... in Чат к каналу @begtin
И стоит денег
источник

VK

Vladislav Kazartsev in Чат к каналу @begtin
Григорий Машанов
И стоит денег
их стоит все, что стоит делать, в этом обществе в это время. в силу природы денег
источник
2020 August 23

NK

ID:0 in Чат к каналу @begtin
Microsoft Flight Simulator [1] - авиасимулятор нового поколения, вышедший 18 августа этого года, вот это действительно большой и самый что ни на есть показательный пример применения открытых данных и технологий работы большими (очень большими) данными. Авиасимулятор работает на основе 2.5 петабайта данных, хранимых в облаке Azure и созданных на основе данных OpenStreetMap и Bing Maps, а также огромного объёма машинного обучения и определения цвета и типа крыш, типа зданий и тд. и тп.

В обзоре от Protocol [2] описывается как серьёзный шаг вперед о сравнению с современной облачной гейминдустрией.

Но не обошлось без казусов, поскольку используются краудосинговые данные которые не всегда хорошо проверены, иногда опечатка может приводить к странным результатам, как, например, гигантский обелиск у Мельбурна [3].

Авиасимулятор, ожидаемо, невероятно требователен к дисковому пространству, его необходимо не менее 150 гигабайт, к каналу связи, оперативной памяти и процессору.

Ссылки:
[1] https://en.wikipedia.org/wiki/Microsoft_Flight_Simulator_(2020_video_game)
[2] https://www.protocol.com/microsoft-flight-simulator-2020
[3] https://www.theverge.com/2020/8/21/21395084/microsoft-flight-simulator-melbourne-obelish-openstreetmap-bing-maps-data-glitch

#opendata #gaming
источник

NK

ID:0 in Чат к каналу @begtin
Курс по дата-этике [1] от Jeremy Howard, создателя Kaggle - это бесплатный академический онлайн курс из 6 уроков:

1. Disinformation
2. Bias & Fairness
3. Ethical Foundations & Practical Tools
4. Privacy & surveillance
5. Our Ecosystem: Metrics, Venture Capital, & Losing the Forest for the Trees
6. Algorithmic Colonialism, and Next Steps

Ранее автор его лично читал в Университете Сан-Франциско в Data Institute в январе-феврале 2020 года [2] , а сейчас курс доступен всем желающим.

А я напомню и про другой курс, того же автора Practical Deep Learning for Coders [3] который связан с книгой Deep Learning for Coders with fastai and PyTorch: AI Applications Without a PhD [4] вышедшей 4 августа 2020 года.

Если Вы хотите разобраться в этике работы с данными при машинном обучении, то сейчас эти курсы, особенно первый, лучшее с чего можно начать

Ссылки:
[1] http://ethics.fast.ai/
[2] https://www.usfca.edu/data-institute
[3] https://course.fast.ai/
[4] https://www.amazon.com/Deep-Learning-Coders-fastai-PyTorch/dp/1492045527

#ai #deeplearning #dataethics
источник

VZ

Vadim Zamilov in Чат к каналу @begtin
Tito Alba
Есть же программы которые звуки проигрывают из dbf или подобных файлов, просто формат подобрать надо.
вопрос в том, что такие программы не установить на "защищенном" компе. а  Office с его VBA всегда под рукой :)
источник

DP

Dmitry Perminov in Чат к каналу @begtin
Где то читал что есть программы которые изменением мерцания монитора могут данные передавать )
источник

IB

Ivan Begtin in Чат к каналу @begtin
Dmitry Perminov
Где то читал что есть программы которые изменением мерцания монитора могут данные передавать )
Есть такая тема и не только в шпионских устройствах - https://hackaday.com/2013/02/25/using-a-flashing-lcd-monitor-to-transfer-data/
источник

IB

Ivan Begtin in Чат к каналу @begtin
и ещё технология Li-Fi https://en.wikipedia.org/wiki/Li-Fi
источник
2020 August 25

NK

ID:0 in Чат к каналу @begtin
За время коронавируса появляются новые отраслевые озёра данных (data lakes) для исследователей, многие с коммерческим уклоном. Например, CVID data lake [1] в рамках продукта Cortelis Research Intelligence от Clarivate [2] аналитического агентства с широким спектром продуктов для исследователей. Они анонсировали это облако, буквально, 5 дней назад, 20 августа [3] и, пока, без подробностей того что находится внутри него.

Существует и другое, бесплатное озеро данных, C3.ai COVID-19 Data Lake [4] от C3.ai соответственно. Подробностей чуть больше, есть демо и описание доступа к озеру через REST API с примерами в Jupiter Notebook и других научных записных книжках. О них была заметка в Forbes [5] ещё в мае 2020 года.

Чуть более простое и, также, бесплатное озеро данных по COVID-19 есть в Amazon AWS [6], включая базы данных и наборы данных особенно большого размера. Например, CORD19 [7], база исследований по коронавирусу для которой на базе AWS существует, в том числе, поисковик cord19.aws [8]

Несколько меньшее по объёму озеро данных есть и в облаке Microsoft Azure [9].

Озера данных это не единственный способ работы исследователей с данными связанными с коронавирусом. Офис стратегии по науке работы с данными при National Institutes of Health в США ведет реестр открытых (open access) ресурсов для исследователей [10] работающих с данных.

В целом складывается ощущение что формирование озер данных в отраслевом применении становится трендом и, в зависимости от выбранной стратегии, здесь большую роль могут сыграть крупнейшие игроки облачных сервисов. Фактически, постепенное развитие Azure Open Datasets, Google BigQuery и Open Data on AWS и показывает что большие общедоступные наборы данных - это хорошая приманка для пользователей облачных сервисов. Некоторые наборы и базы данных давно существуют, только, в облаках. Например, база поискового индекса Commoncrawl существует по умолчанию на Amazon AWS [11]

Для этого у Amazon есть Open Data Sponsorship program [12], у Microsoft есть Open Data Initiative [13], у Google нет отдельной программы, но есть рассказ о том как они работают над открытостью кода и данных [14]

Подводя итог, очень похоже что озера данных для исследователей окажутся устойчивым продуктом и далее будут существовать в двух формах. Профессиональной - закрытые озера данных для профессионалов, с большим числом узкоспециализированных инструментов и общедоступной форме где данные предоставляются крупнейшими игроками облачных решений в рамках их инициатив по открытым данным.

Ссылки:
[1] https://clarivate.com/cortellis/solutions/cvid-data-lake/
[2] https://en.wikipedia.org/wiki/Clarivate
[3] https://finance.yahoo.com/news/clarivate-launches-coronavirus-virology-infectious-140300688.html
[4] https://c3.ai/products/c3-ai-covid-19-data-lake/
[5] https://www.forbes.com/sites/adrianbridgwater/2020/05/27/tom-siebels-c3ai-charts-new-data-lake-for-covid-19-research/
[6] https://aws.amazon.com/ru/covid-19-data-lake/
[7] https://www.semanticscholar.org/cord19
[8] https://cord19.aws
[9] https://azure.microsoft.com/ru-ru/services/open-datasets/catalog/covid-19-data-lake/
[10] https://datascience.nih.gov/covid-19-open-access-resources
[11] https://registry.opendata.aws/commoncrawl/
[12] https://aws.amazon.com/ru/opendata/open-data-sponsorship-program/
[13] https://www.microsoft.com/en-us/open-data-initiative
[14] https://www.blog.google/technology/research/open-source-and-open-data/

#datalakes #data #opendata #covid19 #research
источник

NK

ID:0 in Чат к каналу @begtin
Правительство утвердило Концепцию регулирования технологий ИИ и робототехники, новость на сайте Минэкономразвития [1] и в Российской газете [2] почему-то не содержит ссылки на текст самого актуального документа этой концепции. И тут я не могу не напомнить про одну большую проблему с сайтом федерального правительства и доступности информации на нём. Документы там публикуются с задержкой в месяц, если сейчас (25 августа) открыть сайт в разделе поиска по документам [3] то там будут документы начиная с 25 июля 2020 года. Некоторые, избранные, документы публикуются чуть актуальнее, за 22 августа [4].

Для сравнения, материалы на  официальном интернет-портале правовой информации (publication.pravo.gov.ru) публикуются с задержкой около 3-6 дней с момента подписания [5]. Конечно, надо делать коррекцию на выходные и праздничные дни, но, в общем и в целом, что-то не так с публикацией документов на сайте федерального правительства.

Отходя ещё дальше от концепции и взглянув на номера публикуемых документов мы можем увидеть что на 21 августа было принято 1262 Постановление Правительства (ПП) и 2141 Распоряжение Правительства (РП). В прошлом году всего было принято 1960 ППсок и 3273 РПсок.

Для сравнения, последний номер Указа Президента (УП) на 21 августа был номер 520, в прошлом году их было 604 за весь 2019 год. Кстати на сайте Президента (kremlin.ru) также задержка с публикацией документов в 1.5 месяца (45 дней) [6]

А вот федеральных законов (ФЗ) у нас уже 309 на 31 июля 2020 года, в прошлом году было всего 444, а на 30 июля их было всего 256 [7].

Подвожу итоги:
- количество принятия постановлений и распоряжений правительства, указов Президента и фед. законов выросло за 2020 год несмотря на коронавирус;
- мои оценочные прогнозы к концу года:  4000 РП, 2500 ПП, 800 УП и 600 ФЗ
- оперативность публикации документов на сайтах Правительства и Президента РФ значительно снизилась
- качество написанных документов лучше оценят специалисты

P.S. Статистику нормативной деятельности я веду в небольшом проекте lawstats на data.world где есть и цифры и визуализации по принятым НПА с 1994 по 2019 годы, а также списки самих НПА и статистика по ним.

Ссылки:
[1] https://economy.gov.ru/material/news/pravitelstvo_utverdilo_koncepciyu_regulirovaniya_tehnologiy_ii_i_robototehniki.html
[2] https://rg.ru/2020/08/24/utverzhdena-koncepciia-pravovogo-regulirovaniia-iskusstvennogo-intellekta.html
[3] http://government.ru/docs/all/
[4] http://government.ru/docs/
[5] http://publication.pravo.gov.ru/Search/Period?type=weekly
[6] http://kremlin.ru/acts/bank
[7] http://publication.pravo.gov.ru/Document/View/0001201907300064
[8] https://data.world/infoculture/lawstats

#laws #lawstats #ai
источник

G

Gip24 in Чат к каналу @begtin
ФНС удачно прошла цифровизацию ))
источник

NK

ID:0 in Чат к каналу @begtin
А вот и новости госзакупок связанных с данными в нашей столице. ООО "Центр налоговой политики" [1], директором и единственным бенефициаром которого является, Кирилл Никитин, руководитель российской практики PwC по оказанию услуг государственным органам и компаниям государственного сектора и кандидат в Мосгордуму (остальное желающие сами могут найти в сети), 19 августа выиграло контракт на 100 миллионов рублей [1] у ГБУ города Москвы "Аналитический центр".

Тема контракта весьма интересна: выполнение научно-исследовательской работы по теме «Разработка методологии и реализация комплекса мероприятий по оперативному индикативному мониторингу и прогнозированию состояния отраслей экономики города Москвы».

Фактически он про НИР про работу с данными о состоянии экономики Москвы, про анализ источников, систематизацию и тд.

На что стоит обратить внимание так это на то как этот контракт устроен поэтапно:
- этап 1: даты 20.08.2020 - 18.09.2020 -> ~50 млн. рублей
- этап 2: даты 19.09.2020 - 17.12.2020 -> ~30 млн. руб
- этап 3: даты 18.12.2020 - 30.06.2021 -> ~20 млн рублей

Если считать в такой "смешной" единице измерений как миллионо-день то получится:
- этап 1: 50 млн. руб / 29 дней = 1,72 млн. руб в день
- этап 2: 30 млн. руб / 89 дней = 0,337 млн. руб в день
- этап 3: 20 млн. руб / 194 дней = 0,103 млн. руб в день

А теперь самое интересное, задачи первого этапа из ТЗ контракта (барабанная дробь):
1. Разработка плана мероприятий по организации индикативного мониторинга и прогнозирования состояния экономики города Москвы
2. Разработка плана мероприятий по разработке требований к автоматизированной системе мониторинга и отраслевых мер налоговой и бюджетной политики, способствующих экономическому росту в ключевых отраслях экономики города Москвы

Стоит ли это 50 миллионов рублей за 29 дней? Серьёзно? Два плана мероприятий за месяц и 50 миллионов? Интересно, какая там "маржа" заложена к себестоимости, 1000% ?


Ссылки:
[1] https://www.tax-policy.ru/
[2] https://zakupki.gov.ru/epz/contract/contractCard/document-info.html?reestrNumber=2770483583420000012

#data #spending #moscowgovernment #moscow
источник

NK

ID:0 in Чат к каналу @begtin
[1] Научные исследования: cамые дорогие контракты за прошедшую неделю 16.08.2020-23.08.2020:
Услуги, связанные с научными исследованиями и экспериментальными разработками в области прочих общественных наук и др.
Сумма контракта: 100 млн. руб.
Наименование заказчика: ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ ГОРОДА МОСКВЫ "АНАЛИТИЧЕСКИЙ ЦЕНТР"
Поставщик: ООО "Центр налоговой политики"
Регион: Москва
Дата заключения: 19.08.2020
       
Подробнее о контракте
#научные_исследования
источник

NK

ID:0 in Чат к каналу @begtin
Реестр субсидий на портале Электронного бюджета отображается в обновленном формате. Теперь в нем отсутствуют сведения о ГРБС (надеемся, это техническая ошибка, а не сокрытие данных, как в случае с поставщиками по 223-ФЗ). 🙂

Оперативно выявлять ошибки в открытых данных Минфина России и Казначейства России нам позволяет работа над проектами «Госрасходы» и «Госзатраты». Команды проектов не только собирают,  преобразуют и структурируют данные, но и используют их (что редко встречается в госорганах).

Надеемся, указанные проблемы API и веб-интерфейса реестра субсидий будут быстро исправлены.
источник
2020 August 26

G

Gip24 in Чат к каналу @begtin
А для чего "органу власти" собирать эти данные?! )
источник

f

fr1 in Чат к каналу @begtin
это всё оседает в логах веб-сервера
источник

VK

Vladislav Kazartsev in Чат к каналу @begtin
вот интересно: когда мне звонит абонент сотовой связи и у меня определяется его номер, становлюсь ли я оператором ПД, и где зарегистрироваться?
источник