Какой должна быть СХД для анализа данных?
Системы анализа данных вот уже несколько лет как стали неотъемлемой частью современного крупного бизнеса, да и госструктуры от них не отказываются. Однако, для внедрения подобной системы необходимо, чтобы в компании работала грамотно подобранная СХД — «крепкий фундамент».
Способность быстро анализировать данные и преобразовывать результаты этого анализа в план действий является ценным конкурентным преимуществом. Подобный анализ дает представителям бизнеса четкое представление о том, как работают все процессы (в том числе, и производственные) в их компаниях, что из себя представляют клиенты и рынки, где эти компании играют.
Собственно, именно для этого и нужен анализ данных. Компания Bitkom Survey провела опрос для KPMG, в котором приняли участие 704 предприятия и 102 государственных учреждения Германии с числом сотрудников более 100 человек. Выяснилось, что сегодня уже 4 из 5 компаний принимают бизнес-решения именно на основе анализа данных. Если в 2014 г. процент таких компаний составлял 23%, то в 2016 г. число этих организаций достигло 35%, причем 69% из них отмечают важность анализа данных и его возрастающее значение для бизнеса. Так, по мнению опрошенных, в результате использования систем анализа данных на 70% снижаются бизнес-риски, на 54% лучше персонализируются продукты и сервисы, на 51% четче фокусируются маркетинговые усилия.
Источник: NetApp, 2016
По прогнозу, сделанному на базе того же исследования, в будущем 39% компаний будут пользоваться перспективным анализом данных, а 15% — предписывающим анализом (то есть, отвечающим на вопрос «как это можно осуществить»).
Совпадает с этим прогнозом и мнение аналитиков компании IDC. Согласно исследованию, к 2019 году годовой прирост в этом секторе составит 23,1%, а его объем — 48,6 млн долл. «К 2020 году предприятия, управляемые данными, обгонят своих менее развитых конкурентов», — заявил Филипп Карнелли, директор по исследованиям сектора ПО для бизнеса, IDC Европа.
Плюсы анализа данных:
- оптимизация производственных процессов;
- повышение качества обслуживания клиентов и сведение рисков к минимуму;
- повышение ИТ-безопасности;
- рост эффективности работы;
- более эффективное планирование.
Проекты по внедрению анализа данных являются сложными по своей природе. При этом много времени отнимает собственно планирование и выполнение глобальных ИТ-проектов, а скорость проведения анализа кажется не столь важной. Тем не менее, этот процесс должен быть быстрым, потому что рынок меняется подчас мгновенно и аналитические методы должны адаптироваться к нему весьма оперативно. Именно поэтому структура системы, направленной на анализ данных, должна быть предельно простой. Чем проще будет интегрировать аппаратное и программное обеспечение и управлять им, тем быстрее аналитическое решение будет готово к работе и тем быстрее оно вернет вложенные инвестиции.
Бизнес, который реализует подобный проект, сможет начать получать прибыль от него уже на ранней стадии, что даст компании серьезное конкурентное преимущество. Она сможет даже в чем-то экспериментировать, потому что ошибки на ранней стадии планирования можно исправить прежде, чем они становятся дорогостоящими.
Также необходимым условием часто становится возможность оценки данных в режиме реального времени. С точки зрения прибыли, доля секунды, потраченная на принятие решения, может стать критической. В машине с автоматизированным управлением эта же доля секунды может стать последней перед аварией. В сфере ИТ-безопасности скорость имеет важное значение для обнаружения инцидентов.
Анализ данных нужен везде
Представим себе ситуацию: крупный производитель электроники делает чипы для своих собственных продуктов, а также для других компаний. Эти чипы используются в автомобилях, смартфонах и телевизорах. Конкурентное давление на данный бизнес очень сильно, поэтому дешевизна производства является приоритетной задачей. Тем не менее, производитель страдает из-за простоев предприятия и часто имеет проблемы с браком на производстве, что приводит к его удорожанию.
Использование анализа данных в различных отраслях
Источник: NetApp, 2016
Несомненно, чтобы получить быстрое представление об эффективности производственных процессов и, таким образом, добраться до корня проблемы, компании необходимо прибегнуть к анализу данных.
Не менее действенным может быть анализ данных в госуправлении и финансах. Города и власти все чаще становятся мишенью кибер-атак. Среди наиболее частых проблем — фишинг и человеческий фактор. Обнаружение причины даже одного такого инцидента потребует 16 дней, а 40% всех подобных случаев и вовсе остаются незамеченными. Власти Лос-Анджелеса (США) хотели как можно лучше защитить свои сети и данные, поэтому ими была внедрена система анализа данных. Мониторинг в режиме реального времени позволяет контролировать всю инфраструктуру города в режиме 24/7.
Не менее важно применение анализа данных в здравоохранении, поскольку медицинские учреждения работают с конфиденциальными сведениями о своих пациентах. При этом, данная информация должна быть мобильной и доступной, а допущение утечек невозможно. Нуждается в подобных системах и нефтегазовая отрасль, так как цены меняются, а конкуренты, владеющие новыми источниками энергии, корректируют рынок.
СХД как фундамент анализа данных
Единственным способом принимать оперативные и мотивированные решения является быстрый анализ ситуации. Кроме вычислительной мощности и собственно средств анализа, здесь также весьма важен выбор системы хранения данных. Тестовая лаборатория показала, что профессиональное решение для хранения данных имеет весомые преимущества по сравнению с типовыми серверами.
Преимущества специализированной СХД:
- на 69% более быстрые динамические запросы;
- на 31% больше мощности для статических запросов;
- на 107% ускоряется поиск в потоке.
СХД — это основа для любого решения, ориентированного на анализ данных. При условии огромных объемов корпоративной информации только грамотно выбранная СХД гарантирует, что инструменты анализа могут получить доступ к этим данным достаточно быстро.
Если СХД подобрана неверно, и производительность, и безопасность и, в конечном счете, результат проекта — все будет подвергнуто опасности провала. Вот почему на выбор СХД следует обратить особое внимание.
Андрей Зотов, Cloud.ru: Облачные платформы становятся основой для масштабирования ИИ-решений
Данные поступают из самых разных источников и во множестве форматов. Для того, чтобы полностью использовать эту информацию, пользователи должны иметь возможность не тратить время на её поиск. Доступность данных облегчит, например, такая открытая платформа, как Splunk. Она может получить доступ к любым хранилищам данных, включая Hadoop, и делает сведения свободными для использования.
Решения для анализа данных, как правило, работают в сети распределенных серверов начального уровня, поскольку помимо других факторов свою роль играет и низкая стоимость оборудования. Однако, как уже говорилось, предпочтение следует отдать решениям более высокого класса, поскольку они имеют единый пул данных, что проще в управлении. Даже если какой-либо из компонентов выйдет из строя, система будет функционировать. Неисправный аппаратный компонент можно заменить «на горячую». Кроме того, при таком устройстве хранения информацию легче шифровать. Прежде всего, однако, роль играет возможность использования раздельных массивов для вычисления и хранения, поскольку в таком случае система является более гибкой и легче масштабируется. Теперь ИТ-отдел может подобрать оборудование точно к потребностям предприятия. Это сокращает расходы и повышает производительность. Исследования показали, что Splunk и Hadoop в сочетании с СХД корпоративного класса работают гораздо быстрее.
Тщательно подобранное ПО
Являясь пионером в технологии хранения, NetApp имеет большой опыт в подборе таких программных решений для СХД, которые гарантируют максимальную эффективность анализа данных. В качестве примера можно привести операционную систему SANtricity, которая в сочетании с AFA-платформой NetApp E-Series гарантирует гибкость конфигурации, тонкую настройку и простоту интеграции. Система оптимизирует производительность и параметры рабочей нагрузки, а также повышает эксплуатационную надежность хранения данных. Полный контроль управления обеспечивается программным обеспечением OnCommand Insight. Надо отметить, что в гетерогенную среду SAN могут быть интегрированы не только решения, предлагаемые NetApp, но и компоненты от других производителей.
Достичь быстрой окупаемости инвестиций (ROI), повысить прибыльность и конкурентоспособность помогает программа NetApp Capital Solutions, которая помогает примирить две часто противоположные цели: снижение затрат на ИТ и необходимость инвестиций в эту сферу — в том числе, во внедрения решения для анализа данных.
Полина Осокина