ALP Group запустила коммерческий сервис системного предотвращения ИТ-проблем
ALP Group объявила о начале предоставления на всей территории РФ сервиса централизованного мониторинга и контроля (СЦМК) «Аргус». Как рассказали CNews в компании, услуга, не имеющая аналогов на российском рынке, позволяет организации любого размера перейти от реагирования на отказы ИТ-инфраструктуры к их предвидению и предотвращению. При этом потери компаний от простоев ИТ за год могут снизиться на 70-80%. В проектах импортозамещения СЦМК «Аргус» кардинально упрощает переход на ПО, созданное отечественными разработчиками или международным сообществом Open Source. Кроме того, сервис решает острейшую проблему дефицита ИТ-специалистов высшей квалификации, устраняя одну из главных причин низкого качества обслуживания ИС крупных и средних организаций.
Соединяя мощный специализированный инструментарий с экспертной составляющей (бригады экспертов и другие ресурсы ALP Group), СЦМК «Аргус» является существенным шагом в развитии подходов к мониторингу и контролю сложных корпоративных ИТ-инфраструктур. Предприятие, применяющее этот сервис, приобретает компетенции экспертного уровня, упакованные в современную высокотехнологичную услугу.
Новая услуга ALP Group представляет первостепенный интерес для любой территориально распределенной организации, для которой неприемлемы простои ИС и связанные с этим убытки и репутационные издержки. В первую очередь, это крупный и средний ритейл, государственные и муниципальные структуры, вертикально интегрированные предприятия ТЭК, банковский сектор, провайдеры сервисов SaaS и IaaS, а также небольшие и средние предприятия, предоставляющие профессиональные услуги в сфере управления финансами, аудита, консалтинга и др.
Стоимость сервиса зависит от размера и сложности ИТ-инфраструктуры, от плотности ИТ-сервисов и количества филиалов организации, и колеблется в пределах 2000 – 5000 руб. в месяц за один сервер. Это незначительно увеличивает затраты на ИТ, но позже позволяет существенно сэкономить — до 40% на ФОТ и до 70-80% на потерях из-за простоев ИТ, которые удалось предотвратить. Таким образом, полный функционал СЦМК «Аргус» доступен не только сегменту Enterprise, но и средним по размеру российским организациям.
Для каждой организации-заказчика СЦМК «Аргус» осуществляет непрерывный мониторинг состояния ИС или ее отдельных подсистем, при этом анализ поступающих данных в режиме реального времени, раннее выявление проблем и выработку оптимальных корректирующих действий осуществляет выделенная экспертная бригада сотрудников ALP Group. В состав такой бригады, которая может работать в режиме 24/7, входят специалисты разного профиля — администраторы, системные аналитики, специалисты по сетевой инфраструктуре, виртуализации, ОС, СУБД, платформе «1С:Предприятие», BI-системам и пр. Благодаря высокой квалификации и взаимодействию специалистов разного профиля, а также применению созданных в ALP Group дополнительных ИТ-инструментов и баз знаний, такие бригады способны диагностировать практически любую ИТ-проблему уже при первых признаках ее возникновения, оперативно проверить варианты решения и в режиме онлайн вырабатывать оптимальные рекомендации по ее устранению. Эти рекомендации или применяются сразу (дистанционно или через партнерскую сеть ALP Group), или передаются ИТ-службе предприятия-заказчика — в зависимости от того, какой сценарий работы с СЦМК клиент предпочел приобрести.
В таком режиме ИТ-служба предприятия без каких-либо информационных перегрузок может отслеживать динамику сотен тысяч показателей ИС и контролировать сразу несколько тысяч объектов сложной территориально распределенной ИТ-инфраструктуры (ОС, СУБД, серверы приложений, терминальные серверы, платформы SaaS и IaaS, гибридная ИТ-инфраструктура, сетевая инфраструктура, СХД, системообразующее ПО и программно-аппаратные комплексы в сфере ИБ, отраслевые решения и др.). При этом возрастает не только производительность ИТ-службы, но и точность и оперативность ее работы, а также способность справляться со сложными проблемами.
Экспертная бригада ALP Group предлагает заказчику не первичные («сырые») данные или результаты их обработки, а готовое решение экспертного уровня. Это принципиально отличает СЦМК «Аргус» от системы мониторинга ИТ-инфраструктуры. Благодаря высочайшей квалификации экспертов, доступу к внутренним инструментам и информационным ресурсам ALP Group (базам знаний, Центру компетенций по импортозамещению и Open Source, наработкам подразделения по работе с ритейлом), а также комплексному характеру бригад, возможности последних значительно превышают возможности диагностики ИТ-проблем и выработки ИТ-решений, имеющиеся у большинства департаментов ИТ крупных и средних российских компаний. В особо сложных случаях бригады специалистов ALP Group обращаются в экспертный центр компании, который оказывает им поддержку в режиме реального времени.
Эффективность работы экспертных групп и скорость обнаружения потенциально-проблемных ситуаций в значительной степени обусловлена мощным комплексом инструментов, разработанных в ALP Group и включенных в СЦМК «Аргус». Системные администраторы получают от СЦМК полную информацию о работе вверенных им участков ИС в привычном виде (системные журналы). СЦМК автоматически консолидирует журналы различных элементов ИС, заносит сводную информацию в единую базу данных и позволяет отфильтровывать события по сложным критериям, в том числе, с помощью полнотекстового поиска. Кроме того, в СЦМК имеются средства оперативного анализа данных, в том числе, основанные на искусственном интеллекте. Экспертная система, опираясь на постоянно расширяемый ALP Group набор правил, способна выявлять в потоках событий сложные для обнаружения и диагностики ИТ-проблемы, находящиеся «на стыках» разных сервисов и участков ИС — например, вызванные динамическими нагрузками и мн. др. Система может подсказать, что нужно делать в этой ситуации, а также объяснить свой путь к сделанному выводу.
Еще одна особенность СЦМК «Аргус» — наличие специального пользовательского интерфейса для ИТ-руководителей. Это легко настраиваемая информационная панель (dashboard), на которой в виде интуитивно-понятных визуальных образов наглядно показано состояние объектов инфраструктуры, узлов и сервисов ИС, относящихся к зоне ответственности пользователя. Панель может быть «плоской» или иметь иерархическую структуру, отвечающую уровням макрорегионов, регионов, городов и групп филиалов.
Взглянув на такую панель, ИТ-руководитель любого уровня сразу видит объекты, по которым имеются открытые или ранее устраненные ИТ-проблемы (показан даже возраст проблем). Он может мгновенно оценить состояние ИС и выявить те ее участки, где вероятны трения ИТ- и бизнес-персонала (например, из-за задержек в отработке заявок, сбоях оборудования, снижения производительности бизнес-приложений). Или же где сбои и неполадки могут нанести наибольший ущерб предприятию (например, из-за задержек информации из регионов, не дающих своевременно сформировать консолидированную финансовую, управленческую и кадровую отчетность). Руководитель может тут же связаться с ИТ-персоналом, отвечающим за нужный участок работ, чтобы лучше понять характер рисков, а далее, опираясь на объективные данные из СЦМК, принять необходимые решения и спланировать корректирующие действия.
В СЦМК «Аргус» предусмотрен особый режим работы, предназначенный для организаций, в которых по каким-то причинам действует запрет на ИТ-аутсорсинг. В этом случае представительное подмножество вышеописанных инструментов СЦМК устанавливается в ИС предприятия, и с сервисом работают только сотрудники заказчика: ИТ-руководители разных уровней и системные администраторы. При этом производительность их труда резко возрастает, а риск ошибок снижается. Однако при таком режиме работы они самостоятельно выявляют проблемы и решают, что с ними делать. Это создает риск недостатка компетенций и ресурсов, из-за чего важные сигналы долго игнорируются.
СЦМК «Аргус» позволяет решить такие ИТ-задачи как обслуживание ИС с очень высокими требованиями к темпу устранения ИТ-проблем. В настоящее время наиболее методически проработанным подходом к обслуживанию ИС считаются ИТ-процессы на базе стандартов ITIL. Однако самые распространенные ИТ-процессы (управление инцидентами и управление проблемами) запускаются только когда неприятность уже произошла и предприятие несет связанные с этим убытки. Себестоимость этих процессов резко возрастает по мере сокращения временного «окна», отведенного на устранение неприятностей. А при использовании СЦМК, организация может без лишних затрат получить ИТ-сервис экспертного уровня, способный выявить и устранить ИТ-проблемы раньше, чем они станут заметны пользователям.
Непрерывный аудит ИС: это новый вид ИТ-аудита, позволяющий в режиме реального времени отслеживать работу систем и сервисов в моменты «пиковых» нагрузок, а также при внесении масштабных изменений в ИС. Или при тиражировании однотипных изменений в большое число филиалов. Непрерывный ИТ-аудит позволяет контролировать на основе объективных данных ход и результаты таких изменений и сравнить фактический эффект с ожидаемым.
Повышение эффективности работы ИТ-службы без перевода обслуживания ИС на аутсорсинг. Затраты на СЦМК (5-25% от обычного ФОТ ИТ-службы) компенсируются сокращением части ИТ-персонала (типичное снижение ФОТ составляет 10-40%). И это, не считая снижения потерь от простоев ИТ (для примера: в ритейле, где цену таких простоев умеют считать, потери за год могут снизиться на 70-80%). Также производится отслеживание работы критически важного оборудования (например, торгового оборудования или кассовых аппаратов на предприятиях ритейла).
При решении всех этих задач СЦМК может применяться и как самостоятельное решение, и в связке с ИТ-процессами. Так, непрерывный аудит отлично дополняет процесс управления изменениями, а обслуживание не допускающих простоя ИС и оборудования — с процессами управления инцидентами и проблемами. Совместное использование ИТ-процессов и СЦМК может быть постоянным (для поддержки бесперебойной работы критически важных ИС) или временным (например, для объективного контроля изменений или для предотвращения ИТ-инцидентов в периоды, когда они наносят наибольший ущерб). В настоящее время ALP Group тестирует различные варианты интеграции платформ СЦМК и Service Desk, в первом квартале 2017 это решение станет доступно абонентам СЦМК.
Началу коммерческой эксплуатации СЦМК «Аргус» предшествовала длительная опытно-промышленная эксплуатация сервиса в госсекторе и в ритейле. С июня 2016 го. три крупные организации (каждая из которых имеет от 40 до 100 филиалов на территории РФ) применяют СЦМК на постоянной основе.
Андрей Аксенов, IXcellerate: Повышенный интерес к ИИ провоцирует всплеск спроса на ЦОД-услуги
В одной из них (госкомпания) СЦМК контролирует 4500 единиц серверного оборудования и СХД, более 1000 баз данных, с которыми суммарно работают 20 тыс. пользователей в 100 филиалах. В ритейле параметры наиболее крупного проекта: 200 серверов и столько же критически важных БД, 500 ПК, 1000 кассовых узлов.
Опыт показал, что в таких проектах за один квартал число проанализированных событий превышает 10 тыс., что позволяет предотвратить более 2500 инцидентов разного масштаба, причем примерно 20% относятся к категории критических, т. е. вызывающих остановку основной деятельности или ключевых бизнес-процессов.
В ближайшее время ожидается подключение к СЦМК «Аргус» еще трёх организаций сопоставимого масштаба.
В СЦМК «Аргус» применяются продукты с открытым программным кодом и собственные разработки Центра компетенции по импортозамещению и Open Source ALP Group, такие как система мониторинга Zabbix (версия 3.0) — центральное звено системы сбора, хранения и обработки первичной информации, обеспечивающее агрегирование данных, обработку пороговых значений, инвентаризацию оборудования, прогнозирование изменений по основным показателям, свободное ПО класса middleware, ориентированное на передачу сообщений, RabbitMQ, служит шиной обмена данными между компонентами СЦМК: агентами мониторинга, сервисами хранения и обработки структурированных и неструктурированных данных, системой Service Desk, сервисом отправки уведомлений, Argus Agent и Zabbix Agent отвечают за автоматическое обнаружение и настройку объектов мониторинга, сбор первичных данных и их передачу системе мониторинга. Обеспечивают автоматическое развёртывание, обновление и управление конфигурацией агентов мониторинга. Также это ПО позволяет проводить глубокий анализ состава и состояния аппаратного обеспечения, сервисов SQL Server, Exchange, Hyper-V, Active Directory, DNS, DHCP, Cluster Services, Storage Spaces и др.
ПО Graylog и Elastic Search обеспечивают сбор, обработку и хранение неструктурированных данных и журналов приложений, полнотекстовый поиск, а также фильтрацию и нормализацию, и дальнейшую маршрутизацию получаемых сообщений, извлечение дополнительных полей, добавление вычисляемых полей, определение контекста, привязку геоданных и др.
Сервер приложений Nginx обеспечивает балансировку нагрузки для компонентов СЦМК, ОС Альт Сервер («Базальт СПО») и CentOS — основные операционные системы для компонент СЦМК, собственные разработки ALP Group — средства визуализации информации об ИТ-проблемах на интерактивной карте РФ; инструменты глубокого мониторинга HyperV и MS SQL; сервисы, необходимые для контроля соблюдения ИТ-службой заказчика рекомендаций экспертных групп и лучших практик по настройке приложений; средства разгрузки инженеров в части установок и обновлений агентов; инструменты мониторинга эффективности использования человеческих ресурсов; правила, настройки, алгоритмы работы и различные проверки СЦМК, пользовательские интерфейсы для взаимодействия с сервисом.