ROI = (Доход за период - сумма инвестиций за период) / сумма инвестиций за период необходимо грамотно собрать, посчитать вложения, понесенные на программу. Иностранные эксперты пишут о сложности объективной калькуляции профита и расходов по Data Governance (DG). Важно учесть все активности, статьи, относимые к DG.
Далее представлена попытка перечислить все расходные статьи.
Затраты на сбор данных
- • Использование существующих корпоративных, коммерческих или открытых данных;
- • Сбор детальных или агрегированных данных;
- • Сбор всех или выборочных атрибутов;
- • Сбор всех записей или достаточна репрезентативная выборка;
- • Собираемые данные хранятся в едином формате, стиле, отчетливо интерпретируемы, структурированы, имеют уникальные наименования атрибутов и файлов;
- • Надобны ли транскрипции, переводы;
- • Требуется ли чьё-то согласие на сбор данных;
- • Необходимы ли специальные меры для передачи данных с технического оборудования, мобильных устройств, с полевых объектов или с домашней техники;
- • Нужно ли программное или аппаратное обеспечение для шифрования данных до начала их передачи или для синхронизации данных между местоположениями.
Затраты на обработку данных
- • Требуется ли очистка, парсинг, верификация, дозаполнение данных;
- • Требуется ли соединение, сведение данных, полученных из разных источников;
- • Требуется ли сопоставление данных с мастер данными (MDM);
- • Нужно ли проверять орфографию текстовых данных;
- • Требуется ли обогащение данных;
- • Должны ли быть оцифрованы аналоговые или бумажные данные (карты, фотографии, изображения, газетные вырезки);
- • Требуется ли дополнительное оборудование или программное обеспечение для сканирования, преобразования, обработки.
Затраты на документирование данных
- • Существует ли актуальная модель данных;
- • Таблицы, атрибуты имеют подробные описания;
- • Соблюдаются ли стандарты кодирования, соглашения о наименовании;
- • Имеются в наличии актуальные профили данных;
- • Имеются словари данных, глоссарий терминов;
- • Текстуальные данные, такие как стенограммы интервью, имеют описание контекста;
- • Есть ли документация, описывающая контекст и методологию сбора данных;
- • Существует ли актуальная модель потоков данных, сквозных потоков данных;
- • Есть ли документация по обработке, [обогащению] и контролю качества данных;
- • Используется ли специализированное программное обеспечение класса Data Tools.
Затраты на хранение данных
- • Как часто необходимо делать резервные копии и сколько резервных копий следует хранить;
- • Сколько требуется места для хранения данных.
Затраты на доступ к данным и их безопасность
- • Требуется ли внешним лицам доступ к данным, обеспечение VPN или безопасного FTP доступа;
- • Обязательно ли защищать данные от несанкционированного доступа или распространения;
- • Требуется ли шифрование файлов, данных перед хранением или передачей;
- • Требуется ли обезличивание данных или псевдонимизацию перед хранением или передачей и далее;
- • Требуется ли выделенный безопасный сервер, дополнительное программное / аппаратное обеспечение.
Затраты на доступность и повторное использование данных
- • Имеют ли другие стороны авторские права на данные, нужно их согласие на утилизацию данных;
- • Необходимо получить разрешение на авторское право, прежде чем делиться данными;
- • Нужны ли юридические услуги;
- • Существуют требования по приведению данных, метаданных к конкретным стандартам.
Затраты на консервирование данных
- • Требуется ли преобразование данных в стандартный или открытый формат для долгосрочного сохранения;
- • Требуется ли специальное программное или аппаратное обеспечение для преобразования.
Общие расходы
- • Организация и проведение встреч команд;
- • Распределение ролей и обязанностей, специальный менеджер ресурсов;
- • Вовлечение архитектора баз данных или архитектора хранилища данных;
- • Услуги администратора баз данных;
- • Привлечение внешнего консалтинга;
- • Обучение, тренинг персонала, практические семинары.
Какие-то из перечисленных выше пунктов могут быть не актуальны для конкретной организации. И всё же, приступая к работе (или к отдельному проекту?) по расчету окупаемости Data Governance полезно иметь подобный чек-лист.