Смартсорсинг.ру

Сообщество руководителей ИТ-компаний, ИТ-подразделений и сервисных центров

Статьи в блогах Вопросы и ответы Темы в лентах ITSM 365 Пользователи Компании Лента заказов Курс по ITSM

Мониторинг в ЦОДах: сбросить «лоскутное одеяло» (часть 1)

Мониторинг в ЦОДах: сбросить «лоскутное одеяло» (часть 1)

В дата-центре, как и на любом комплекном объекте, качественное управление – один из основных способов борьбы за экономическую эффективность: по данным Gartner, оптимизация управления системами ЦОД позволяет сократить его операционные расходы, в среднем, на 30%. Не последнюю роль в этом играет мониторинг работы дата-центра – и каждой его системы, и объекта в целом. Несмотря на постоянные совершенствования и обновления инструментов мониторинга, его задачи не изменились… если не с сотворения мира, то с создания первого ЦОДа – точно.

Все под контролем

Рынок предлагает несколько вариантов решения задачи мониторинга дата-центров – контроль по SNMP (Simple network management protocol, концепция DCIM( Data Center Infrastructure Management) и многие другие варианты отлаживания процесса сбора критически важной информации.  В качестве инструментов используются как специальные отраслевые решения, так и общие промышленные системы автоматического мониторинга и контроля.

Как правило, системы мониторинга предполагают интеграцию информационных технологий и систем управления объектом для максимальной централизации на основе датчиков контроля окружающей среды и сетевой инфраструктуры, ПО для моделирования процессов и системы управления информационными активами. «Глаза» ЦОДа – датчики температуры, влажности и давления. В последнее время ими оборудуется и кабельная инфраструктура, что позволяет определять состояние элементов СКС.

Персонал в режиме реального времени должен контролировать работу инженерных и ИТ-систем дата-центра, своевременно выявлять внештатные ситуации и ликвидировать их до наступления негативных последствий. Современные программные решения для контроля окружающей среды и электропитания способны моделировать параметры, выявляя потенциальные проблемы и позволяя проактивно управлять рисками сбоев. Хотя планово-предупредительный ремонт и техническое обслуживание систем ЦОДа происходят по своим графикам, информация об их проведении также учитывается в системе мониторинга – это важно для предотвращения «ложных тревог».

Big brother is watching you, and you….and you!

Одна из особенностей мониторинга в российских дата-центрах – необходимость сочетать программные решения нескольких вендоров для обеспечения 360° обзора критически важных инженерных систем.

Контролируется все – от жизненно важных систем ЦОДа (уровень температуры и влажности, готовность системы пожаротушения, показатели энергообеспечения) до физической безопасности периметра и помещений (системы СКУД, видеонаблюдение). Поэтому дата-центр оснащается сложнейшим комплексом технических средств. В России каждая из этих систем интегрировалась в комплекс блока мониторинга по отдельности, что со временем усложняло процесс централизованного мониторинга и увеличивало риск сбоев.

Сегодня ЦОДы пытаются решить эту проблему за счет создания комплексных решений по мониторингу, объединив средства наблюдения за работой ЦОДа от нескольких вендоров на единой программной платформе.

Так, ЦОД «Технопарк-Мордовия» внедрил недавно решение на базе трех программных продуктов: EMC Ionix (мониторинг доступности всех компонентов ИТ-инфраструктуры ЦОД), EMC APG (накопление статистики и анализ производительности) и VMware vCenter Operations Enterprise (интеллектуальный мониторинг производительности и мощностей объектов виртуальной среды VMware).

Система позволила решить не только задачи мониторинга, но и управления и анализа ИТ-ресурсов и сервисов ЦОДа, в том числе: автоматизированный учет объектов ИТ-инфраструктуры, автоматическое выявление и регистрация проблем, классификация их по степени критичности и определение причин их возникновения, расчет последствий, сбор и накопление метрик качества работы ИТ-инфраструктуры, интеллектуальный анализ данных в виде различных отчетов и динамических панелей и т.д. Это – «классический» набор функционала системы мониторинга, необходимой сегодня в крупном ЦОДе.

В ЦОД «ТрастИнфо» к созданию единой системы мониторинга подходят, прежде всего, с точки зрения программного обеспечения – новинки «железа» для задач мониторинга не столь распространены. Если нет нареканий к уже установленным датчикам, задачи заменять их, как правило, не возникает - главное, чтобы они сохранили свою точность и надежность после внедрения нового софта. Проблема в области ПО для мониторинга уже много лет всегда одна и таже. Специалистов, которые разбираются в специализированных программных платформах в России – единицы. Отсюда – и значительная стоимость их услуг, и низкая доступность: сроки устранения сбоев могут вполне официально составлять полтора-два месяца с момента обращения. Очевидно, что такая ситуация неприемлема для провайдера, ведь он несет ответственность перед заказчиками за каждый час простоя, возникшего в дата-центре. 

Каждый производитель решений для ЦОДов стремится к тому, чтобы они были в дата-центре единственными. Соответственно, для совмещения решений разных вендоров (а такая ситуация может возникнуть, например, в процессе слияний и поглощений или при приобретении нового ЦОДа для расширения сети существующих) нужны значительные дополнительные затраты. 

На чем сфокусировать внимание и как сократить затраты на мониторинг критически важных систем дата-центра без ущерба для безопасности - поговорим в следующей публикации. 

Комментарии (0)