Главное о метаданных

УПРАВЛЕНИЕ ЗНАНИЯМИ  Главное Категория:  УПРАВЛЕНИЕ ЗНАНИЯМИ
Опубликовал:         18.09.2019               print

Обучающаяся организация - это организация, которая ставит своей задачей проактивное повышение коллективных знаний своих работников умственного труда (Knowledge Workers). Работники умственного труда стремятся приобрести опыт посредством усвоения информации, а затем применять этот опыт путем принятия аргументированных и осознанных решений, действий. Подобно данным и информации, знания также являются корпоративным ресурсом. Управление данными и управление знаниями - тесно связанные дисциплины. Данные - основа информации, знаний и, в конечном счете, мудрости и осознанных действий.



Как управление знаниями, так и управление данными зависят от высокого качества данных и информации. Всегда ли данные являются достоверными? Нет, данные могут быть неточными, неполными, устаревшими, и непонятыми. Существенное влияние для обеспечения доверия к данным имеют метаданные.

Метаданные - это информация о данных.
Международный стандарт метаданных ISO / IEC 11179 разработан и введён для стандартизации, регистрации элементов данных с целью сделать данные понятными и доступными для совместного использования.
Управление метаданными - одно из направлений Data Governance; набор процессов, обеспечивающих качественное и своевременное создание, хранение, интеграцию и контроль за метаданными для последующего повторного использования.


Полезность метаданных

Метаданные, включая определения бизнес-данных, помогают установить контекст данных, и поэтому управление метаданными напрямую влияет на улучшение качества информации. Управление информационными активами включает в себя управление данными и метаданными. (The DAMA Guide toThe Data ManagementBody of Knowledge (DAMA-DMBOK Guide), стр. 2)


Использование метаданных в компании обеспечивает ей следующие преимущества:
(The DAMA Guide toThe Data ManagementBody of Knowledge (DAMA-DMBOK Guide), стр. 259-260)

  1. Повышение ценности стратегической информации (например, хранилища данных, CRM, SCM и т.д.), обеспечение контекста данных, таким образом, содействие аналитикам в принятии более эффективных решений;
  2. Сокращение расходов на обучение и снижение влияния текучести кадров путем тщательного документирования контекста данных, истории и происхождения;
  3. Сокращение времени исследований, ориентированных на данные, помощь бизнес-аналитикам своевременно найти необходимую им информацию;
  4. Улучшение коммуникаций, сокращение разрыва между бизнес-пользователями и ИТ-специалистами, переиспользование результатов работ, выполняемых другими командами, и повышение доверия к данным ИТ-систем;
  5. Увеличение скорости вывода разработанной системы на рынок / в продуктив за счет сокращения времени жизненного цикла разработки системы;
  6. Снижение риска отказа от проекта посредством анализа влияния на различных уровнях во время управления изменениями;
  7. Идентификация и сокращение объемов данных и процессов, тем самым снижение переработки и использование избыточных, устаревших или неправильных данных.


Говоря простыми словами, недостаточно спроектировать структуру базы данных, создать и наполнить базу корректными данными, наладить интеграцию, обеспечить её производительность, масштабируемость, надежность, безопасность, важно сделать возможным потом во всем этом разобраться, не допустить образования "черных ящиков", неуправляемого legacy.






Перечень метаданных

Не претендуя на полноту, перечислим виды метаданных:

  • • Концептуальные модели данных;
  • • Логические модели данных: сущности, атрибуты, связи и правила, бизнес-наименования;
    Концептуальные и логические модели данных - это прежде всего язык, инструмент результативной коммуникации между Бизнесом и IT ;
  • • Физические модели данных: файлы, схемы, таблицы, поля, домены, представления, синонимы, индексы, триггеры;
  • • Описания таблиц и представлений;
  • • Определения данных: типы данных полей, их длина и точность;
  • • Описания полей, включая особенности данных с увязкой к процессам;
  • • Правила и ограничения, накладываемые на данные: обязательность заполнения полей, правила проверки, допустимые значения;
  • • Связи ссылочной целостности (физические / декларативные / ассоциативные) между таблицами базы данных;
  • • Описание вычисляемых показателей;
  • • Описание предназначения функций, хранимых процедур, программных пакетов; описание входных и выходных параметров; комментарии по тексту кода;
  • • Дескрипция интеграции данных: источники данных, целевые сущности, карты мэппингов, описание преобразований / трансформаций данных, зависимости, рабочие потоки ETL, методы и расписания, продолжительность обмена данными, контрольные точки;
  • • Качество данных: правила очистки, обогащения данных; контролируемые дефекты, метрики, рейтинги;
  • • Профили данных - статистические показатели;
  • • Иерархии, дизайн агрегатов данных;
  • • Каталоги и учетные карточки отчетов: инвентарные номера, системные и бизнес-наименования, описания, тэги, ответственные лица и т.п.;
  • • Глоссарий бизнес-терминов;
  • • Переводы на другие языки наименований объектов, атрибутов, полей;
  • • Связи, сопоставления данных этапам бизнес-процессов;
  • • Безопасность данных: роли, пользователи данных, членство пользователей в ролях; ролевые матрицы доступа; технические учетные записи, логины, пароли;
  • • Информация о сервис-ориентированной архитектуре: компоненты, сервисы, сообщения, мастер-данные;
  • • Управление системой: платформы, лицензии, конфигурационные единицы, надежность, уровни обслуживания.


Помимо сказанных выше метаданных, относящихся преимущественно к базам данных традиционных платформ, NoSQL данные имеют свои характеристики.


Немного об основных игроках на рынке систем управления метаданными:




Энергия идеи   dvbi.ru                    Последнее изменение: 2021-10-15 22:37:49Z         Возрастная аудитория: 14-70         Комментариев:  0
Теги:  Управление
Связанные статьи:

Пожалуйста, проголосуйте и ниже поставьте лайк:   rating


  Комментарии



Следующая статья:    Обоснование необходимости моделирования данных
Предыдущая статья:  Критерии оценки систем управления данными