Size: a a a

Чат к каналу @begtin

2017 October 31

OP

Olya Parkhimovich in Чат к каналу @begtin
Виталий
на самом деле информация об организации это самая простая (ну с моей т.з.) вещь. Ведь есть ЕСИА. И при ее использовании занестии что-то не то крайне проблематично.
чтобы окончательно разрушить вашу веру в данные госзакупок уточню, что одно время (не знаю как сейчас) в одном из полей контрактов указывалось название страны, которое пользователь вводил вручную. Поэтому при анализе контрактов одного из федеральных университетов я увидела больше 10 вариантов того, как можно написать "Российская Федерация". По сравнению с этим ввести правильно данные о поставщиках сравнимо с написанием кандидатской ))
источник

OP

Olya Parkhimovich in Чат к каналу @begtin
Виталий
напишу =)
отлично!
источник

В

Виталий in Чат к каналу @begtin
Olya Parkhimovich
чтобы окончательно разрушить вашу веру в данные госзакупок уточню, что одно время (не знаю как сейчас) в одном из полей контрактов указывалось название страны, которое пользователь вводил вручную. Поэтому при анализе контрактов одного из федеральных университетов я увидела больше 10 вариантов того, как можно написать "Российская Федерация". По сравнению с этим ввести правильно данные о поставщиках сравнимо с написанием кандидатской ))
источник

В

Виталий in Чат к каналу @begtin
на самом деле за последний год у меня вера в гос.данные вообще практически исчезла.
ну т.е. есть хорошие источники и есть ужас-ужас. Но косяки есть везде. Причем критичные =(
источник

OP

Olya Parkhimovich in Чат к каналу @begtin
Виталий
на самом деле за последний год у меня вера в гос.данные вообще практически исчезла.
ну т.е. есть хорошие источники и есть ужас-ужас. Но косяки есть везде. Причем критичные =(
надо просто как минимум о них знать и делать оговорки в любой аналитике :)
источник

В

Виталий in Чат к каналу @begtin
ага. так и живем
источник

IB

Ivan Begtin in Чат к каналу @begtin
мы ручками чистим эти данные в openngo.ru
источник

IB

Ivan Begtin in Чат к каналу @begtin
но только потому как их там сотни тысяч, а не миллионы контрактов
источник

IB

Ivan Begtin in Чат к каналу @begtin
А также планируем чистить их в apicrafter.ru
источник

AB

Anton [az09@osm] Belichkov in Чат к каналу @begtin
перечитывал https://t.me/begtin/600, много думал
(на самом деле нет)
Telegram
Ivan Begtin
Еще одна иллюстрация к вопросу о качестве и достоверности государственных баз данных.

Пара живых примеров.

1. Репозитарий
Контракт N 2591902626917000023 [1] [2] от 2016-12-23 на 10 тыс. руб. на оказание услуг общедоступной электрической связи для нужд структурного подразделения по г. Березники был заключен между Государственным казенным учреждением Пермского края социального обслуживания населения "Центр помощи детям оставшимся без попечения родителей г. Соликамска" и, по регистрационной карточке контракта, с Акционерным обществом "Новый регистратор" (ИНН: 7719263354 КПП: 771801001).

Однако при проверке по документам оказывается что это договор между Пермским филиалом Ростелекома и данным ГБУ. Это видно по первой и последней странице и реквизитам в госконтракте [3].

Как реквизиты организации выступающей в роли репозитария ценных бумаг оказались в реквизитах госконтракта на поставку электросвязи в Березникам - для меня загадка.

Как минимум тут признаками аномалии является:
1. Не соответствие профиля деятельности…
источник

IB

Ivan Begtin in Чат к каналу @begtin
ну реальная ситуация с данными еще хуже
источник

AB

Anton [az09@osm] Belichkov in Чат к каналу @begtin
Команда аналитиков «Яндекса» знает, какие сны снятся в разных городах России, по каким улицам мы ходим и что едим на обед.

Strelka Magazine поговорил с главой исследовательской команды Наталией Крупениной о том, как они достают и используют данные, о целях исследований и о том, как полученные результаты влияют на бизнес и журналистику.

http://telegra.ph/Podschitat-nevozmozhnoe-Kak-kompaniya-YAndeks-ispolzuet-sobrannuyu-o-nas-informaciyu-10-31
источник

AB

Anton [az09@osm] Belichkov in Чат к каналу @begtin
Датасет: ассоциации к словам и выражениям русского языка
https://habrahabr.ru/post/341406/
Tags: Открытые данные, nlp, word2vec, ассоциации, дистрибутивная семантика, русский язык, датасеты, открытые данные
Author kdenisk on #habrahabr
источник

AB

Anton [az09@osm] Belichkov in Чат к каналу @begtin
@unknownpersonyouknow чья работа? :)
источник

IB

Ivan Begtin in Чат к каналу @begtin
Команда аналитиков Яндекса много что собирает, но даже Гугл отдает больше данных(
источник

AB

Anton [az09@osm] Belichkov in Чат к каналу @begtin
поэтому сюда а не в другой чат )
источник
2017 November 01

uy

unknownperson youknow in Чат к каналу @begtin
источник

AB

Anton [az09@osm] Belichkov in Чат к каналу @begtin
Значит не угадал)
Но надеюсь то что выложили на хабре будет полезно
источник

NK

ID:362960488 in Чат к каналу @begtin
доброго вечера. в блоге http://ivan.begtin.name/ все записи 404
источник

NK

ID:362960488 in Чат к каналу @begtin
можете автора уведомить?
источник