Разделы

Бизнес Цифровизация Инфраструктура Бизнес-приложения

Хранилища данных: шаги от идеи до внедрения

От качества владения информацией зависит многое в бизнесе: быстрота решений, анализ результатов, чёткость и глубина представления "картины" бизнес-связей и т.п. С хранилищами данных связывали и продолжают связывать большие надежды в сфере развития информационной индустрии.

Отдельно стоит остановиться на проблемах, возникающих при проектировании и создании хранилищ данных. Во-первых, необходимо создать группу, в которую должны войти аналитики-технологи или ответственные лица от отделов, заинтересованных в получении аналитических данных, а так же специалисты ИТ-отдела, занимающиеся данной проблематикой. В рамках этой группы принимаются и согласовываются наиболее важные решения. Таким образом, она должна быть наделена соответствующими полномочиями.

Только в союзе специалистов разных отделов и ИТ-отдела необходимо проводить работы, связанные с созданием хранилища данных, чтобы достичь максимально эффективного результата. Любая компания пользуется определенной нормативно-справочной информацией (НСИ ), в которой определены категории показателей и применяемые к ним требования. От того, насколько полно и недвусмысленно описаны данные категории, типы данных и форматы их хранения, зависит состояние информационной системы в целом. Поэтому первое, с чем сталкиваются на стадии подготовки к проектированию хранилища – это анализ НСИ и ее упорядочение.

Стандартизация и создание единого информационного пространства – необходимое условие для построения бизнес–модели. При этом стандартизация не должна влиять на качество представления информации для различных подразделений. Любого рода данные должны быть пригодны к анализу соответствующей категорией работников.

Надо четко себе представлять, что хранилище данных – это не "волшебная палочка-выручалочка" в управлении информацией. Оно строится на основании первичной информации и если эти данные были введены некорректно, не полно, если к ним не были предъявлены соответствующие требования и не ведется проверка, то и "на выходе" мы получим "сточную канаву" вместо мощного средства анализа и поддержки принятия решения. То есть проблема качества данных должна решаться до построения хранилища, на уровне источников данных и их связи между собой. Или же, что часто происходит, принятие решения о проектировании и создании хранилища, а затем анализ имеющихся данных приводят к осознанию того факта, что данные необходимо приводить в порядок.

Из наиболее часто возникающих вопросов можно выделить задачу определения периодичности сбора, загрузки и обработки информации из различных источников первичной информации – транзакционных баз данных, то есть как часто необходимо обновлять данные в хранилище. От этого зависит, как и когда запускать соответствующие процедуры, какие требования предъявлять к каналам передачи данных в сети, как распределять нагрузку. Что касается процедур ETL, то существует целый ряд мощных инструментов от различных поставщиков, также активно используются на данном этапе хранимые серверные процедуры, благодаря которым, избегая больших издержек, можно регулировать параметры данного процесса.

Еще одна важная задача – это обеспечение безопасности. Каким образом распределить доступ к хранилищу, как организовать защиту от сбоев (это и каналы связи, и сервера БД, резервное копирование) – вот вопросы, которые обязательно надо планировать и разрешать. Широко распространен способ предоставления полномочий и использование данных в хранилище на ролевой основе, когда пользователю или группе пользователей назначается определенная роль, согласно которой определяется возможность доступа к определенным группам данных, причем уровнем детализации предоставляемых данных можно весьма гибко варьировать.

Очень важным аспектом в построении хранилищ и их эксплуатации является оценка уровня актуальности данных в нем. Эта оценка осуществляется с помощью статистики запросов к различным категориям данных за определенные значимые для компании периоды времени. Сбор и анализ такой информации является неотъемлемой частью эффективной работы с хранилищем. Результаты такой аналитической работы позволяют решить, какие данные оставить в оперативном доступе, а какие переместить в архивную часть, надо ли увеличить производительность, отметить и устранить слабые стороны в плане производительности.

Что делать, если инфраструктура не успевает за ростом бизнеса?
Маркет

Выбор разработчика зависит от ИТ-штата

Выбор разработчика хранилища данных зависит от объемов решаемых задач, квалификации и количества сотрудников ИТ-отдела, а так же финансовой составляющей. Топ-менеджменту компании предварительно необходимо проанализировать работу собственного ИТ-отдела и уже на основании этого принимать решение. Здесь необходимо также учитывать опыт и квалификацию руководства отделов и сотрудников, которые будут вовлечены в процесс создания хранилища.

От того, как грамотно они смогут ставить свои задачи и взаимодействия с ИТ-отделом, зависит успех проекта. Никто лучше собственных сотрудников (если это, конечно, квалифицированный персонал) не знает бизнес компании и его тонкие моменты. Так же во многих компаниях может остро проявиться вопрос утечки информации.

Илья Штефан / CNews