Централизованная система мониторинга информационных систем (ЦСМИС) на базе продуктов HP для компании МТС

Заказчик: МобильныеТелеСистемы (МТС)

Для компании МТС, одного из ведущих российских телеком-операторов, важно, что называется, держать марку во всех регионах присутствия. Это касается в том числе и качества оказания абонентских ИТ-услуг. Данный фактор впрямую влияет на отношение к бренду в целом и в условиях высокой конкуренции может стать определяющим для потребителя.

ОАО «Мобильные ТелеСистемы» (МТС) оказывает услуги сотовой связи (в стандартах GSM, UMTS (3G) и LTE), услуги проводной телефонной связи, широкополосного доступа в интернет, мобильного телевидения, кабельного телевидения, цифрового телевидения и сопутствующие услуги, в частности услуги по продаже контента. По состоянию на март 2014 года компания во всех странах своего присутствия обслуживала более 107 млн абонентов. В 2014 году бренд МТС седьмой год подряд вошел в топ-100 самых дорогих брендов в мире в рейтинге BRANDZ™, опубликованном международным исследовательским агентством Millward Brown, признан самым дорогим российским телекоммуникационным брендом, вошел в десятку крупнейших по стоимости мировых телекоммуникационных брендов. С июня 2000 года акции МТС котируются на Нью-йоркской фондовой бирже под кодом MBT.

«Поддерживать одинаково высокий уровень предоставления ИТ-сервисов по всей стране довольно трудно без централизованного комплексного контроля функционирования всего ИТ-ландшафта и деятельности ИТ-подразделений на местах, – рассказывает директор Департамента оперативного мониторинга информационных систем (ДОМИС) компании “МТС” Сергей Дубинец. – Для этого на базе филиала макрорегион «Юг» в Краснодаре было создано наше подразделение. Сегодня ДОМИС силами всего лишь 4-х одновременно работающих специалистов дежурной смены может контролировать работу всех ИТ-сервисов МТС класса mission- и business-critical (в их числе тарификация, прием платежей, блокировки, интернет-помощник и др.)». Новый подход обусловил появление новых инструментов. Территориальная распределенность и уникальность контролируемой инфраструктуры потребовали создания централизованной системы мониторинга в масштабах страны.

По результатам анализа различных решений в качестве платформы были выбраны технологии HP, одного из лидеров рынка систем управления ИТ. Конкурс на реализацию проекта выиграла компания «Инфосистемы Джет».

ЦСМИС – коротко о главном:

  • создана за 5 месяцев на базе HP Business Service Management (BSM);
  • охватывает более 10 тыс. объектов различного типа (серверов, систем виртуализации и хранения, активного сетевого оборудования, системного и прикладного ПО, СУБД) в 7 макрорегионах;
  • контролирует состояние ИС класса mission- и business-critical, а также ряд business support систем;
  • поддерживает автоматизированое выполнение регламентных процедур;
  • обеспечивает автоматизированную постановку на мониторинг новых объектов после их внесения в реестр точек мониторинга

Охватить все и сразу

Со стороны ИТ-руководства компании принципиальным условием была возможность постоянного отслеживания доступности ИТ-сервисов, предоставляемых пользователям, абонентам МТС. С технической точки зрения это означало обеспечение сквозного мониторинга – от уровня абонентских услуг до уровня компонентов инфраструктуры. Кроме того, с учетом планируемых нагрузок нужно было максимально автоматизировать деятельность специалистов ДОМИС.

«Обычно такие комплексные проекты длятся около года, но ввиду высокой значимости ЦСМИС для бизнеса на внедрение решения было отведено всего 5 месяцев, – рассказывает руководитель Департамента систем управления компании “Инфосистемы Джет” Алексей Николаев. – Для нас как интегратора это был своего рода вызов – пришлось учесть заданные ограничения при разработке архитектуры и выборе применяемых технологий, а также пересмотреть сам подход к реализации. В итоге уже через 100 рабочих дней система была запущена в эксплуатацию».

Централизованный мониторинг как он есть

ЦСМИС – не просто система мониторинга, подающая сигналы о неисправностях, это полноценная комплексная система управления. «В архитектуру решения мы заложили два базовых принципа, которые позволили существенно увеличить эффективность работы ДОМИС и ИТ-подразделений в регионах, – рассказывает руководитель проекта, начальник отдела управления проектами Департамента систем управления компании «Инфосистемы Джет» Руслан Тукмаков. Во-первых, система позволяет анализировать все поступающие события и определять список возможных корневых причин их возникновения. Это в разы сокращает общее количество обрабатываемых администраторами событий, ускоряет первичную диагностику и помогает корректно определить команду, в чьей зоне ответственности находится нештатная ситуация. Во-вторых, решение позволяет определить, насколько корневая причина влияет на предоставление конечного сервиса, т.е. помогает приоритизировать действия ИТ-специалистов».

Реализация данной концепции началась с комплексного обследования ИТ-ландшафта МТС и изучения логики работы информационных систем. Проектная команда совместно с сотрудниками ДОМИС разработала сервисно-ресурсные модели, отражающие зависимости и влияние компонентов прикладного и инфраструктурного уровня на ИТ-сервисы. Были внедрены средства автоматизации процессов мониторинга на базе продукта HP Business Service Management (BSM), разработаны и настроены правила многоступенчатой обработки событий.

В контур контроля вошли серверы, системы виртуализации и хранения, активное сетевое оборудование, системное и прикладное ПО, а также СУБД – в общей сложности более 10 тысяч объектов различного типа в 7 макрорегионах. За счет технологии безагентского мониторинга все подключения к объектам мониторинга для сбора показателей их доступности и производительности происходят удаленно. Это значительно ускорило развертывание ЦСМИС в распределенной ИТ-инфраструктуре телеком-оператора.

Помимо мониторинга компонентов ИТ-ландшафта, реализован контроль качества ИТ-услуг на стороне абонентов. Для этого применяются механизмы синтетического мониторинга (т.е. эмуляции действий реальных пользователей в информационных системах), что позволяет однозначно определить доступность и производительность этих систем.

Обслуживать проще

Параллельно с построением системы мониторинга закладывались и возможности для ее удобной и эффективной эксплуатации. Для сотрудников ДОМИС определены и автоматизированы с помощью комплекса программных средств типовые задачи по диагностике и поддержке работоспособности систем. При этом часть рутинных операций, не требующих участия людей, решение способно выполнять самостоятельно. Автоматизация не только ускорила обработку поступающих событий мониторинга, но и существенно снизила риски ошибок при подключении в контур контроля новых ИС любого масштаба. Последнее особенно важно, так как речь идет о тысячах объектов – ручной труд в таких условиях неприемлем.

Благодаря собственным разработкам компании «Инфосистемы Джет», интегрированным с продуктами HP, созданы уникальные для российского рынка решения. В частности, модуль загрузки объектов мониторинга (МЗОМ) позволяет настраивать в автоматизированном режиме мониторинг тысяч серверов и сетевых узлов. Для своей работы он использует базу конфигураций – так называемый реестр точек мониторинга, содержащий полную информацию по каждому собираемому показателю (около 27 тысяч метрик). Такой подход помогает избежать пропуска серьезных аварий из-за ошибок и неучтенных программных и аппаратных ресурсов. Кроме того, был внедрен модуль проверки доступности объектов, который контролирует корректность мониторинга имеющихся и готовность к нему новых компонентов инфраструктуры, а также оповещает сотрудников ДОМИС о выявленных проблемах.

«Системы автоматизации процессов эксплуатации (так называемые оркестраторы) – для России относительно новое явление. МТС – одна из передовых компаний, в которых данные решения внедрены и реально используются, – поясняет главный конструктор проекта, старший инженер-проектировщик систем управления компании «Инфосистемы Джет» Константин Корниенко. – Нацеленность на результат и готовность к инновациям со стороны руководства ДОМИС позволили нам реализовать в проекте собственные технические идеи, которые не только обогатили функциональность системы мониторинга, но и сократили сроки проекта внедрения».

Компания МТС получила удобную технологическую платформу для работы Департамента оперативного мониторинга ИС. Максимальная автоматизация позволила контролировать состояние ИТ-сервисов в масштабе страны силами дежурной смены, состоящей всего из 4-х специалистов отдела оперативного мониторинга ИС.

«Совместно с нашими партнерами нам удалось создать уникальную для российской телеком-отрасли систему мониторинга ИС, позволяющую получать полную картину о состоянии ключевых процессов на всех уровнях во всех регионах присутствия, что существенно повышает надежность бизнес-процессов компании и абонентских сервисов. Тонкая настройка и адаптация ЦСМИС под наши нужды позволила снизить нагрузку на ИТ-подразделения и повысить отказоустойчивость систем за счет максимальной автоматизации рутинных операций, значительного сокращения времени на выявление корневых причин событий и появления возможности проактивного мониторинга, – отмечает директор Департамента оперативного мониторинга информационных систем компании “МТС” Сергей Дубинец. – Таким образом, мы получили ценный инструмент для управления событиями в соответствии с лучшими практиками ITIL, цель которого – исключить возможность нештатных ситуаций, влияющих на стабильность работы ИС».

«Высокая результативность данного проекта связана в том числе с максимальной вовлеченностью ИТ-специалистов МТС в процесс внедрения, – рассказывает руководитель Департамента систем управления компании “Инфосистемы Джет” Алексей Николаев. – Коллеги с готовностью осваивали новые для себя задачи. В результате за короткий срок система стала для них “родной”, что упростило последующую эксплуатацию».

«Мы рады очередному успешному внедрению решения HP Business Service Management (BSM) в крупнейшей российской компании. Уверен, что система, построенная на платформе HP BSM, обеспечит компании МТС эффективное управление корпоративными приложениями, системами и ИТ-инфраструктурой, комментирует Андрей Кутуков, директор HP Software в России. В конечном счете, решение поможет оператору существенно повысить качество предоставляемых клиентам услуг».