Международная конференция разработчиков
и пользователей свободного программного обеспечения

Zabbix - контроль ситуации везде и всегда

Тимофей Пирожник, Minsk, Belarus

LVEE 2016

With the development of infrastructure and the addition of services (third party products) it becomes too difficult or even impossible to keep track of the current state of systems and services. The most correct response on such challenge is to use the monitoring system. Zabbix project is a free/libre solution for such a task.

Введение

С развитием инфраструктуры и добавлением серверов и сервисов (сторонних продуктов) уследить за текущим состоянием информационной системы становится череcчур тяжело либо скорее всего невозможно. Наиболее правильный выход из сложившейся ситуации – ввод в эксплуатацию системы мониторинга.

Когда мы столкнулись с подобной идеей, из представленных программных продуктов была сделана простейшая выборка, которая исключала коммерческие продукты (в т.ч. таковые с бесплатным пробным периодом); также были исключены системы мониторинга, использующие в своей непосредственной работе Java либо Javascript; исключены системы, работающие исключительно с *nix (на момент внедрения в организации использовались различные ОС). В результате выбор пал на Zabbix.

Обзор возможностей/ Технический обзор

Согласно документации, Zabbix следит за «узлами» сети. Под узлами подразумевается все, что можно опросить и получить удобочитаемый/внятный ответ об их состоянии. Очевидный объект для опроса – физические (гипервизоры) и виртуальные сервера. Приложив определённые усилия, можно наблюдать за рабочими станциями (это актуально для тех, кто работает на аутсорсе). Также доступно наблюдение за состоянием определенных сервисов (приложения, службы, ресурсы, веб-мониторинг). И конечно же, доступен мониторинг для сети и сетевого оборудования.

Минимальные требования по аппаратной части для сервера мониторинга вариативны из-за разного количества узлов и наблюдаемых параметров. Например, два разных сервера Zabbix с приблизительно одинаковым количеством узлов и одинаковой архитектурой (на одном сервере установлен сам Zabbix и база данных), работающие через агент и SNMP, потребовали совершенно разные ресурсы.

Способы мониторинга также разнообразны. “Из коробки” предлагаются такие варианты, как web-мониторинг – проверка наличия в доступе станицы (сайта) плюс имитация действий пользователя, статистические данные (время ответа). Протокол SNMP – один из основных способов мониторинга сетевого оборудования, и его поддерживает подавляющее количество устройств. Также используется Zabbix-агент — клиентская часть для серверов и рабочих станций.

Набор действий при появлении событий на первый взгляд скромен: можно либо отправить сообщение о событии, либо выполнить некое действие. Варианты оповещения достаточно вариативны, и выбор протокола остается за администратором. Действия, в контексте Zabbix, это выполнение скриптов, и таки образом способы реагировать на события расширяются до границ фантазии администратора.

Опыт использования в реальном проекте

Zabbix был использован нами для построения системы мониторинга за сервисом “клиент-банк” крупной финансовой компании. Он показал себя как отличный пример решения open source, которое работает “из коробки”, хотя и требует определенной грамотности и здравого смысла при развёртывании. По нашему опыту можно сказать, что в большинстве ситуаций внедрение не вызывает сложностей, но есть незадокументированые особенности, выявление которых происходит только во время эксплуатации.

Нестандартное применение Zabbix

С завидным постоянством (вероятно, в результате развития информационных технологий) появляются задачи, которые по сути не относятся к мониторингу, но могут быть реализованы средствами системы. Система мониторинга как таковая ограничивается только фантазией администратора, и потому при необходимости легко обеспечивает выход за рамки стандартных проверок серверов и сервисов.

Заключение

После ввода системы мониторинга в нашем случае сократилось время простоя основных сервисов, предоставляемых организацией (соответственно начался спад недовольных клиентов), появилось больше времени на оптимизацию сервисов и улучшение их качества.

Abstract licensed under Creative Commons Attribution-ShareAlike 3.0 license

Назад