Zabbix - контроль ситуации везде и всегда
LVEE 2016
Введение
С развитием инфраструктуры и добавлением серверов и сервисов (сторонних продуктов) уследить за текущим состоянием информационной системы становится череcчур тяжело либо скорее всего невозможно. Наиболее правильный выход из сложившейся ситуации – ввод в эксплуатацию системы мониторинга.
Когда мы столкнулись с подобной идеей, из представленных программных продуктов была сделана простейшая выборка, которая исключала коммерческие продукты (в т.ч. таковые с бесплатным пробным периодом); также были исключены системы мониторинга, использующие в своей непосредственной работе Java либо Javascript; исключены системы, работающие исключительно с *nix (на момент внедрения в организации использовались различные ОС). В результате выбор пал на Zabbix.
Обзор возможностей/ Технический обзор
Согласно документации, Zabbix следит за «узлами» сети. Под узлами подразумевается все, что можно опросить и получить удобочитаемый/внятный ответ об их состоянии. Очевидный объект для опроса – физические (гипервизоры) и виртуальные сервера. Приложив определённые усилия, можно наблюдать за рабочими станциями (это актуально для тех, кто работает на аутсорсе). Также доступно наблюдение за состоянием определенных сервисов (приложения, службы, ресурсы, веб-мониторинг). И конечно же, доступен мониторинг для сети и сетевого оборудования.
Минимальные требования по аппаратной части для сервера мониторинга вариативны из-за разного количества узлов и наблюдаемых параметров. Например, два разных сервера Zabbix с приблизительно одинаковым количеством узлов и одинаковой архитектурой (на одном сервере установлен сам Zabbix и база данных), работающие через агент и SNMP, потребовали совершенно разные ресурсы.
Способы мониторинга также разнообразны. “Из коробки” предлагаются такие варианты, как web-мониторинг – проверка наличия в доступе станицы (сайта) плюс имитация действий пользователя, статистические данные (время ответа). Протокол SNMP – один из основных способов мониторинга сетевого оборудования, и его поддерживает подавляющее количество устройств. Также используется Zabbix-агент — клиентская часть для серверов и рабочих станций.
Набор действий при появлении событий на первый взгляд скромен: можно либо отправить сообщение о событии, либо выполнить некое действие. Варианты оповещения достаточно вариативны, и выбор протокола остается за администратором. Действия, в контексте Zabbix, это выполнение скриптов, и таки образом способы реагировать на события расширяются до границ фантазии администратора.
Опыт использования в реальном проекте
Zabbix был использован нами для построения системы мониторинга за сервисом “клиент-банк” крупной финансовой компании. Он показал себя как отличный пример решения open source, которое работает “из коробки”, хотя и требует определенной грамотности и здравого смысла при развёртывании. По нашему опыту можно сказать, что в большинстве ситуаций внедрение не вызывает сложностей, но есть незадокументированые особенности, выявление которых происходит только во время эксплуатации.
Нестандартное применение Zabbix
С завидным постоянством (вероятно, в результате развития информационных технологий) появляются задачи, которые по сути не относятся к мониторингу, но могут быть реализованы средствами системы. Система мониторинга как таковая ограничивается только фантазией администратора, и потому при необходимости легко обеспечивает выход за рамки стандартных проверок серверов и сервисов.
Заключение
После ввода системы мониторинга в нашем случае сократилось время простоя основных сервисов, предоставляемых организацией (соответственно начался спад недовольных клиентов), появилось больше времени на оптимизацию сервисов и улучшение их качества.
Abstract licensed under Creative Commons Attribution-ShareAlike 3.0 license
Back