Size: a a a

Инжиниринг Данных

2020 November 18
Инжиниринг Данных
источник
Инжиниринг Данных
источник
2020 November 19
Инжиниринг Данных
SCD — Slowly Changing Dimensions

На одном собеседовании меня спросили как бы я спроектировал табличку для хранения показателей датчика, который иногда но нерегулярно меняется; и так, чтобы потом можно было найти показание за определённую дату простым запросом, не перебирая всю таблицу.

Сначала я долго тупил, но потом минут за 30 мы с собеседующим пришли к рабочему варианту… это оказался вариант по типу SCD2 — уже давно придумали как надо правильно.

Всего типов 6 — вот небольшая статья с примерами данных для каждого типа:
https://habr.com/ru/post/101544/
источник
Инжиниринг Данных
Вышло обновление книги по визуализации данных, от главного тренера и евангелиста по Табло - Andy Kirk - Data Visualisation: A Handbook for Data Driven Design

Другой крутой мужик по Табло это Ryan Sleeper, у него есть 2 книги по Табло, и я их видел в PDF.
источник
Инжиниринг Данных
источник
2020 November 20
Инжиниринг Данных
источник
Инжиниринг Данных
Завтра выступаю https://data-science-ua.com/conference/wp-content/uploads/2020/10/9th-Data-Science-UA-Conference-Agenda.pdf от Амазон, хотя уже не в амазон😝, на последок так сказать
источник
Инжиниринг Данных
Netflix создал еще одно решение - Бульдозер, для экспорта данных из хранилища данных в NoSQL. https://netflixtechblog.com/bulldozer-batch-data-moving-from-data-warehouse-to-online-key-value-stores-41bac13863f8
источник
Инжиниринг Данных
Еще один термин, который чем-то зацепил - Data Discovery Platform. Подробности тут.
источник
Инжиниринг Данных
Довольный большая серия постов “Building data-driven organizations”.
Part 1: What it means to be data-driven
Part 2: Why organizations fail to make data-driven decisions
Part 3: How to operationalize better decision-making
источник
Инжиниринг Данных
источник
Инжиниринг Данных
источник
Инжиниринг Данных
Как часто мы забываем о конечном потребителе и углубляется в технические дебри
источник
2020 November 21
Инжиниринг Данных
Pandas vs PySpark, статья про то, когда, что использовать.
источник
Инжиниринг Данных
источник
2020 November 22
Инжиниринг Данных
В продолжение capcha
источник
Инжиниринг Данных
О мотивации.

Меня очень привлекает тема мотивации, реализации себя в деятельности. Ну а раз уж вышло так, что на работе мы проводим бОльшую часть своего времени, то  личностная реализация в работе - то, что доктор прописал для повышения качества жизни.

Очень люблю и долго перевариваю статью о соединении целей компании и человека.

Перечитала ее раза 3, сформулировала свою цель, нашла свой архетип и теперь потихоньку наблюдаю за другими - что же их драйвит и активирует.
Наверное это начало чего-то нового и интересного.
источник
Инжиниринг Данных
Обожаю свежие проекты с 0, но потом приходят они...
источник
Инжиниринг Данных
Очень крутая история про теории заговора, на примере создании монополии лампочек в 1920х годах. Причем ссылку нашел под обсуждением функциональности SAP, где уже известен факт, что SAP делает свое решение не простым, чтобы было место для продажи услуг консалтинга и поле работы для сети партнёров.
источник
2020 November 23
Инжиниринг Данных
Я собрался с силами, и решил написать статью про Rock Your Data на хабр, почти инструкцию по созданию консалтинг компании. Это такой pet project, который дал много полезного опыта и знакомств, познакомил и посорил с разными людьми. Если кому интересно, то вот презентация, которую я собрал в конце 2019 года по результатам работы за 1,5 года и следующими шагами, но потом случилась пандемия и многое изменились.
источник