Size: a a a

Чат к каналу @begtin

2020 August 03

NK

ID:0 in Чат к каналу @begtin
К вопросу о "терминологических спорах". Их тоже очень любят в академической среде и поэтому там регулярно разрабатываются тезаурусы. Тезаурус, практически всегда - это не что-то сделанное на бегу, а полноценный и большой проект.

Пример подобного тезауруса - это HASSET [1], британский справочник по гуманитарным и социальным наукам созданный в рамках UK Data Service. Справочник включает чуть более 11800 терминов отклассифицированных как:
-    Preferred Terms (предпочитетельные)
-    Use For (UFs) or Non-Preferred Terms (используемые для...)
-    Broader Terms (BTs) (широкие)
-    Narrower Terms (NTs) (узкие)
-    Related Terms (RTs) (связанные)

Справочник представлен как связанные данные и связан со онтологией SKOS [2]

А также его можно получить целиком по ссылке [3].

Другой пример профессионально сделанного тезауруса про данные - это тезаурус данных Network of the National Library of Medicine в США [4] где по каждому термину приведены все первоисточники на основе которых он строился и даже при тезаурусе в 70 понятий у него указываются все авторы и составители персонально
---
The Data Thesaurus is the updated eScience Thesaurus which was created by Kevin Read in 2013 and previously resided on the eScience Portal for Librarians (Read et al., 2013). The Thesaurus was rebranded and updated in 2018 by Tess Grynoch for the NNLM RD3 site.
---
Таких примеров ещё много. И не только в области работы с данными, а во всех профессиональных областях. Один и тот же термин в области бухучёта может означать совсем не то же что в регулировании госуслуг, к примеру.

Списки и глоссарии терминов устроены так что ты или делаешь их "тяп-ляп", например делаешь сайт по какой-то теме и выводишь их списком, либо придумываешь свои термины или интерпретацию с прицелом на то что они стали общепринятыми, либо подходишь к этому профессионально и описываешь каждый термин в модели полноценной базы данных тезауруса.

Ссылки:
[1] https://hasset.ukdataservice.ac.uk
[2] https://lod.data-archive.ac.uk/v2-skoshasset/page/en-GB/
[3] https://hasset.ukdataservice.ac.uk/hasset-guide/obtaining-hasset.aspx
[4] https://nnlm.gov/data/thesaurus

#terms #data #glossary
источник

AS

Al Sem in Чат к каналу @begtin
Гурбангулы Бердымухамедов выложил все свои книги в открытый доступ:


https://neutrality.gov.tm/library/ru
источник

AS

Al Sem in Чат к каналу @begtin
Всем открытых данных
источник

IB

Ivan Begtin in Чат к каналу @begtin
Al Sem
Гурбангулы Бердымухамедов выложил все свои книги в открытый доступ:


https://neutrality.gov.tm/library/ru
Под Creative Commons?
источник

AS

Al Sem in Чат к каналу @begtin
Ivan Begtin
Под Creative Commons?
А вот не вижу никаких указаний на сайте
источник

IB

Ivan Begtin in Чат к каналу @begtin
Al Sem
А вот не вижу никаких указаний на сайте
Ах как жаль. Вот право слово, такие книги должны быть достоянием всех жителей Земли
источник

AB

Albert Bertyakov in Чат к каналу @begtin
Al Sem
Всем открытых данных
Если книги не в машиночитаемом формате, то это не открытые данные. Хотя, машину, которая должна будет это читать, жалко
источник

VK

Vladislav Kazartsev in Чат к каналу @begtin
Albert Bertyakov
Если книги не в машиночитаемом формате, то это не открытые данные. Хотя, машину, которая должна будет это читать, жалко
Из всего можно извлечь пользу.

Вот прогнали бы тексты через анализатор, да сравнили:
- один автор или много,
- меняется ли автор / лексика и т. д. во времени и как,
- как тексты соотносятся с современным корпусом национальной литературы.

И все это сегодня требует скорее свободного времени, чем невероятного ума или невиданных ресурсов — отличное развлечение для студентов на зачет-автомат
источник
2020 August 04

G

Gip24 in Чат к каналу @begtin
А это нормально, если фед. орган власти держит свои реестры за "бугром"?
В частности, Минстрой держит государственный "Реестр экономически эффективной проектной документации" на
https://view.officeapps.live.com/op
источник

G

Gip24 in Чат к каналу @begtin
источник

IB

Ivan Begtin in Чат к каналу @begtin
Вы на ссылки внимательнее посмотрите, они не реестр держат "за бугром", а используют инструменты предпросмотра документов которые хранятся у них на сайте
источник

G

Gip24 in Чат к каналу @begtin
Ок. Если буквально, да. Пусть так. Но вопрос остается - а своего нет? А если "забугор" отключат как посмотреть будет реестр если он ведет туда?
источник

IB

Ivan Begtin in Чат к каналу @begtin
Gip24
Ок. Если буквально, да. Пусть так. Но вопрос остается - а своего нет? А если "забугор" отключат как посмотреть будет реестр если он ведет туда?
Если забугор отключат до доступность файлов Минстроя будет нашей самой небольшой проблемой
источник

G

Gip24 in Чат к каналу @begtin
Других проблем не будет. Суверенный рунет всех спасет и всё победит. Всем нам это обещали депутаты, Минсвязь и прочие его строители...
))
источник

IB

Ivan Begtin in Чат к каналу @begtin
Файлы - это ерунда, вот примеры госсайтов хостящихся зарубежом
- energourok.ru, IP 31.170.123.72, DFL-NET, хостинг UKWEBHOSTING
Но таких примеров осталось мало
источник

G

Gip24 in Чат к каналу @begtin
Ivan Begtin
Файлы - это ерунда, вот примеры госсайтов хостящихся зарубежом
- energourok.ru, IP 31.170.123.72, DFL-NET, хостинг UKWEBHOSTING
Но таких примеров осталось мало
Понятно, что есть вещи куда более серьезнее.  В глаза видны явные, это как-то не суверенно, и не гоже в рамках политики импортозамещения и представления что там всюду враги...
источник

NK

ID:0 in Чат к каналу @begtin
К вопросу о том что изменилось за последние годы с государственной ИТ инфраструктурой, гораздо меньше стало прямой зависимости от не-российских сервисов (но осталось много косвенных зависимостей).

Например, очень немногие сайты госорганов или сделанных за бюджетные средства теперь хостятся за рубежом.
Единственные которые остались в моём личном списке:
- energourok.ru, IP 31.170.123.72, хостинг UKWEBHOSTING (просветительский сайт Минэнерго России)
- old.minstroyrf.ru, IP 178.238.232.114, хостинг Contabo, Германия, сейчас отключен (старый сайт Минстроя РФ)
- torgi.fas.gov.ru, IP 23.236.62.147, платформа создания сайтов Wix, США, сейчас отключён (один из проектов ФАС России)
И, наконец, вишенка на торте, сервер "s.mil.ru" - это укорачиватель ссылок используемый в Минобороны РФ. Этот домен - это custom domain сервиса Bit.ly (США). С его помощью создаются и публикуются ссылки на сайте Минобороны

Это всё без учёта многочисленных бюджетных учреждений, унитарных предприятий и иных структур органов власти. Только по доменам в зоне .gov.ru и по доменам которые относятся к федеральным органам власти, 7502 домена

Если провести аналогичный анализ региональных сайтов/доменов и сайтов госучреждений, то картина будет покрасочнее.

Поэтому пока можно сказать что на федеральном уровне такие случаи стали редкостью. А вот косвенных зависимостей таких как установка отслеживающих кодов, внедренных сервисов и тд. очень много. Какие-то ведомства вставляют в свои страницы визуализацию в Tableau, какие то PowerBI, какие-то самые разные другие инструменты.

Хорошо это или плохо? Это неорганизовано. Госполитики в этой области нет, беда со всеми внедренными сервисами в неархивируемости представленных там материалов.

#government #it #infrastructure
источник

G

Gip24 in Чат к каналу @begtin
- Бывший директор дивизиона "Государственные продукты и сервисы" Сбербанка Дмитрий Огуряев назначен замминистра цифрового развития, связи и массовых коммуникаций РФ

https://tass.ru/ekonomika/9118169
источник

G

Gip24 in Чат к каналу @begtin
В Новой Зеландии правительство страны первым в мире объявило о создании так называемой Хартии алгоритмов

https://data.govt.nz/use-data/data-ethics/government-algorithm-transparency-and-accountability/algorithm-charter

- правительство Новой Зеландии обязуется сообщать, что оно использует какие-либо алгоритмы при разработке и принятии решений или в работе любых систем - под алгоритмами здесь имеются в виду любые аналитические инструменты, от регрессионных моделей прогнозирования до нейросетей - и объяснять простым человеческим языком, как они устроены и как работают.
источник

AS

Al Sem in Чат к каналу @begtin
Gip24
В Новой Зеландии правительство страны первым в мире объявило о создании так называемой Хартии алгоритмов

https://data.govt.nz/use-data/data-ethics/government-algorithm-transparency-and-accountability/algorithm-charter

- правительство Новой Зеландии обязуется сообщать, что оно использует какие-либо алгоритмы при разработке и принятии решений или в работе любых систем - под алгоритмами здесь имеются в виду любые аналитические инструменты, от регрессионных моделей прогнозирования до нейросетей - и объяснять простым человеческим языком, как они устроены и как работают.
Пххх
С учетом того, что НЗ - одна из немногих стран, где есть прям закон о госбэкдорах🤔
источник