Zabbix настройка оповещений по триггерам

Триггеры и глобальные переходы

Мы не рекомендуем настраивать триггеры для глобальных переходов, если вы не уверены, что понимаете, как триггер повлияет на поведение задачи.

Глобальный переход позволяет любому статусу в рабочем процессе перейти к определенному статусу. Это представлено в средстве просмотра рабочего процесса / редактором черным цветом  категории статуса (поле которое связывает этап выполнения задачи и статус ), указывающие на статус, на который нацелен глобальный переход. Дополнительные сведения о глобальных переходах см. в разделе «Расширенная настройка рабочего процесса».

Настройка триггеров для глобальных переходов часто может привести к неожиданному переходу на целевой статус глобального перехода. Например, подумайте над тем, настроен ли триггер «Создана фиксация кода» (Commit created) для глобального перехода к статусу «В разработке» (In Progress) . Код фиксации может происходить на многих этапах во время жизненного цикла задачи (например, для написания исходного кода, изменения кода после проверки и т. д.). Это может привести к тому, что проблема будет неправильно переходить к «В разработке» (In Progress) из ряда статусов, таких как «В обзоре» (In Review) или «Готово» (Done).

Совет. Если вы используете глобальные переходы в своем рабочем процессе, у вас, вероятно, будет несколько переходов в статус. Это означает, что у пользователей будет несколько вариантов рабочего процесса по задаче (например, как «Начало прогресса» (Start progress), так и «В разработке» (In Progress)). Чтобы скрыть опции, добавьте условие «Скрыть переход от пользователя» (Hide transition from user)к соответствующим переходам.

Дополнительные материалы по Zabbix

Онлайн курс «DevOps практики и инструменты»

Если у вас есть желание научиться строить и поддерживать высокодоступные и надежные системы, научиться непрерывной поставке ПО, мониторингу и логированию web приложений, рекомендую познакомиться с онлайн-курсом «DevOps практики и инструменты» в OTUS. Курс не для новичков, для поступления нужны базовые знания по сетям и установке Linux на виртуалку. Обучение длится 5 месяцев, после чего успешные выпускники курса смогут пройти собеседования у партнеров.

Проверьте себя на вступительном тесте и смотрите программу детальнее по .

Рекомендую полезные материалы по Zabbix:
Настройки системы
  • Установка 4.0
  • Обновление 3.0 -> 3.2
  • Обновление 3.4 -> 4.0
  • Установка Zabbix Proxy
  • Работа на NGINX

Видео и подробное описание установки и настройки Zabbix 4.0, а также установка агентов на linux и windows и подключение их к мониторингу.

Подробное описание обновления системы мониторинга zabbix версии 3.4 до новой версии 4.0.

Пошаговая процедура обновления сервера мониторинга zabbix 2.4 до 3.0. Подробное описание каждого шага с пояснениями и рекомендациями.

Подробное описание установки и настройки zabbix proxy для организации распределенной системы мониторинга. Все показано на примерах.

Подробное описание установки системы мониторинга Zabbix на веб сервер на базе nginx + php-fpm.

Мониторинг служб и сервисов
 
  • Температура процессора
  • Nginx и php-fpm
  • Mysql репликация
  • Службы Linux
  • Рейд mdadm
  • Транки Asterisk
  • Synology

Мониторинг температуры процессора с помощью zabbix на Windows сервере с использованием пользовательских скриптов.

Настройка полноценного мониторинга web сервера nginx и php-fpm в zabbix с помощью скриптов и пользовательских параметров.

Мониторинг репликации mysql с помощью Zabbix. Подробный разбор методики и тестирование работы.

Описание настройки мониторинга tcp служб с помощью zabbix и его инструмента простых проверок (simple checks)

Настройка мониторинга рейда mdadm с помощью zabbix. Подробное пояснение принципа работы и пошаговая инструкция.

Подробное описание мониторинга регистраций транков (trunk) в asterisk с помощью сервера мониторинга zabbix.

Подробная инструкция со скриншотами по настройке мониторинга по snmp дискового хранилища synology с помощью сервера мониторинга zabbix.

Мониторинг различных значений
  • Мониторинг сайта
  • Мониторинг бэкапов
  • Размер бэкапа
  • Делегирование домена
  • Значения из текстового файла
  • Мониторинг логов

Настройка мониторинга web сайта в zabbix. Параметры для наблюдения — доступность сайта, время отклика, скорость доступа к сайту.

Один из способов мониторинга бэкапов с помощью zabbix через проверку даты последнего изменения файла из архивной копии с помощью vfs.file.time.

Подробное описание настройки мониторинга размера бэкапов в Zabbix с помощью внешних скриптов.

Пример настройки мониторинга за временем делегирования домена с помощью Zabbix и внешнего скрипта. Все скрипты и готовый шаблон представлены.

Пример распознавания и мониторинга за изменением значений в обычных текстовых файлах с помощью zabbix.

Описание мониторинга лог файлов в zabbix на примере анализа лога программы apcupsd. Отправка оповещений по событиям из лога.

Пользовательское сопоставление от инструментов разработки до JIRA

Следующий процесс описывает, как пользователь инструмента разработки сопоставляется с пользователем JIRA для триггеров рабочего процесса. Он применяется ко всем событиям, однако каждый инструмент разработки использует другой адрес электронной почты и имя пользователя для сопоставления (см. Пункт маркера после описания процесса ниже).

  • Процесс: пользователь, инициирующий событие в инструменте разработки, сопоставляется с пользователем JIRA, сопоставляя адрес электронной почты, а затем имя пользователя, т. е.
    • Один пользователь JIRA с соответствующим адресом электронной почты — Перейдите к задаче как пользователь JIRA.
    • Нет пользователей JIRA с соответствующим адресом электронной почты — Перейдите к задаче как анонимный пользователь.
    • Несколько пользователей с соответствующим адресом электронной почты в JIRA — Попробуйте найти подходящее имя пользователя в этой группе пользователей. Если есть пользователь JIRA с совпадающим именем пользователя, перейдите к задаче как пользователь JIRA. Если нет совпадающего имени пользователя, перейдите к задаче как анонимный пользователь.
  • Адрес электронной почты и имя пользователя, используемые для сопоставления пользователей:

Собитие (я)

Адрес электронной почты и имя пользователя, используемые для сопоставления пользователей

Все события перемещения запроса(request)

Адрес электронной почты сервера Bitbucket и  пользовательское имя пользователя, который выполнил перемещение запроса(request).

Созданная фиксация кода

Адрес электронной почты, связанный с фиксацией кода и именем пользователя Bitbucket Server, с которым  сопоставляется адрес электронной почты. Если адрес электронной почты не сопоставляется с именем пользователя, будут использоваться имена авторов из фиксации кода.

Созданная ветвь

Адрес электронной почты сервера Bitbucket и пользовательское имя аутентифицированного пользователя, который переместил ветвь на сервер Bitbucket.

Дашборд Яндекс.Метрика 2.0

Да, я просто взглянул на систему аналитики другими глазами. Мы привыкли использовать Метрику как инструмент по анализу поведения пользователей на сайте. Для половины владельцев сайтов этот инструмент и вовсе счетчик посетителей.

Все началось с простого понимания: поведение пользователей напрямую зависит от состояния вашего сайта. Особенно если сайт имеет высокую посещаемость. В этом случае посетители – это большая армия бесплатных тестировщиков, которые проверяют ваш ресурс 24 часа в сутки. А вам остается просто наблюдать и не вмешиваться в этот процесс, пока все идет по плану. Сила социальной инженерии в действии. Здорово, не правда ли?

Знаю, мы все не любим длинные тексты, поэтому перейдем сразу к делу. Ниже я расскажу, из чего состоит мой дашборд и как настроить эти виджеты для ваших сайтов. После этого вы сможете полностью возложить задачу мониторинга сайта на плечи этой системы.

Трафик

Ранжирование, индексация, видимость сайта, доступность сайта, региональность

Мне он позволяет быстро следить за объемами трафика с поисковых систем. Сразу видны просадки. В случае возникновения проблем я увижу отклонение в самые короткие сроки.

Как настроить:

1. Виджет «Линии»

2. Основное (Значения группировки > Визиты > Визиты > Источник трафика)

3. График (Переходы с поисковых систем + итого и среднее)

Так я отслеживаю видимость сайта по регионам. Любые всплески и падения трафика будут видны на графике. Вот, например, с ЦФО что-то стало неладно, стоит сделать выводы.

Важно отметить, что график легко настраивается параметрами «Детализация по дням, неделям, месяцам». Как настроить:

Как настроить:

1. Виджет «Линии»

2. Основное (Значения группировки > Визиты > Визиты > Округ (или город)

3. График (выберите целевые регионы)

Не знаю, как вы, а мой сайт получает достаточное количество трафика с картинок, чтобы держаться за него и тем более контролировать.

Как настроить:

1. Виджет «Показатель»

2. Основное (Визиты > Визиты)

3. Сегментация (Источники > Первый источника трафика > Поисковая система: Google Картинки, Яндекс Картинки) 

Для многих клиентов узнаваемость бренда – очень важный показатель. Я с ними полностью солидарен. Поэтому, проводя множество PR-мероприятий, полезно следить за изменением количества брендовых запросов.

Как настроить:

1. Виджет «Показатель»

2. Основное (Визиты > Визиты)

3. Сегментация (Источники > Первый источника трафика > Поисковая фраза)

4. Далее вводим конструкцию @название_вашего_бренда во всех возможных вариациях.

Что покажет данный виджет:

1. «Дырки», через которые уходит трафик с сайта.

2. Чужеродные ссылки (крауд, спам и т.д.).

3. Возможность повесить реферальную ссылку.

4. Возможность заменить ссылку на арбитражную.

Как настроить:

1. Виджет «Таблица»

2. Основное (Внешние переходы > Количество переходов > Внешняя ссылка)

На моем сайте всего 4 раздела. Так я контролирую изменение трафика по разделам. Вижу рост и просадку каждого в отдельности. Помогает быстро реагировать и возвращать трафик с поиска.

Как настроить:

1. Виджет «Линии»

2. Основное (Значения группировки > Визиты > Визиты > Страница входа ур. 2)

3. Настройте графики под себя

На одном сайте я использовал круговую диаграмму, чтобы увидеть момент, когда пора внедрять адаптивный дизайн. И нужен ли он вообще.

Позже узнал, что адаптивный дизайн увеличивает количество заходов с мобильных устройств и к тому же улучшает позиции в десктопе.

Возможно, кому-то этот график пригодится еще для чего-то.

Найти его можно в библиотеке виджетов.

Как изменить внешний вид панели инструментов

Параметры экрана

Параметры экрана позволяют скрывать / отображать определенные виджеты, которые вы видите на экране панели инструментов WordPress. Чтобы скрыть / отобразить определенные виджеты, нажмите кнопку «Параметры экрана» в правом верхнем углу экрана панели инструментов. При нажатии на «Параметры экрана» откроется раскрывающееся меню. Это меню содержит имена виджетов, которые присутствуют на экране панели инструментов, а также флажки перед каждым именем виджета.

Чтобы скрыть виджет, просто снимите флажок перед его именем, и виджет исчезнет с экрана администратора.

Точно так же, если вы хотите показать виджет, просто отметьте флажок галочкой, и виджет снова появится на экране администратора.

Возможность изменить цвета панели инструментов

Не нравится стандартная цветовая схема панели управления WordPress и вы хотите ее изменить? Не волнуйтесь! WordPress позволяет пользователям изменять цветовую схему своей панели администратора.

Чтобы внести изменения, наведите указатель мыши на имя пользователя, которое вы видите в правом верхнем углу экрана администратора; появится раскрывающееся меню. В раскрывающемся меню выберите «Редактировать мой профиль».

Вы будете перенаправлены на новую страницу «Профиль», которая содержит параметры, специфичные для вошедшего в систему пользователя.

На странице «Профиль» вы увидите параметр «Цветовая схема администратора», который управляет цветовой схемой панели управления.

По умолчанию WordPress предоставляет восемь различных цветовых схем, из которых вы можете выбирать.

Выберите желаемую цветовую схему из предоставленного выбора, и цветовая схема для вашей панели управления WordPress будет изменена.

Мониторинг сайта с авторизацией

Немного усложним задачу. Давайте попробует выполнить авторизацию на сайте и провести мониторинг как самой авторизации, так и закрытой страницы за ней. Я для примера возьму форум centos.org/forums/, авторизуюсь на нем и после авторизации проверю страницу с персональной информацией конкретного пользователя.

Для того, чтобы настроить в zabbix мониторинг сайта с авторизацией, надо правильно сформировать post запрос для этой самой авторизации. Я это делаю следующим образом. Иду на страницу с авторизацией. В данном случае это https://www.centos.org/forums/ucp.php?mode=login, открываю DevTools в Сhrome, вкладку Network. Заполняю поля формы авторизации заведомо неправильными данными, чтобы авторизация завершилась ошибкой. После этой ошибки смотрю заголовки самого первого запроса.

Я нажимаю на view source в разделе Form Data и копирую получившуюся строку. В моем случае она была такая:

username=VladimirZp&password=pass123&redirect=.%2Fucp.php%3Fmode%3Dlogin&sid=70389f827540ef7a1fb7acb4e3bbad12&redirect=index.php&login=Login

Отсюда точно можно убрать параметр redirect. В итоге сохраняю вот такую строку:

username=VladimirZp&password=pass123&sid=70389f827540ef7a1fb7acb4e3bbad12&redirect=index.php&login=Login

Теперь иду в шаблон для мониторинга сайтов и добавляю новый сайт — centos.org. Создаю первый шаг с авторизацией, называю его auth. В нем же указываю post запрос для авторизации.

Не забудьте поменять пароль на правильный. После успешной авторизации вы увидите главную страницу форума, где будет ссылка на приватные сообщения форума. Эта ссылка доступна только после авторизации.

Следующим шагом делаем проверку строки Private messages на главной странице форума.

Шаги выполняются последовательно. На первом шаге мы только авторизовываемся, на втором проверяем страницу, доступную уже после авторизации. Идем в Latest Data и смотрим результат.

Оба шага успешно завершены, ошибок нет. Посмотрим раздел Monitoring -> Web.

Здесь тоже все в порядке. Наглядно видно, что процесс авторизации гораздо дольше и медленнее, чем загрузка главной страницы.

Какое влияние триггеры оказывают на нашу жизнь

Очень немногие могут контролировать своё поведение под воздействием внешних раздражителей: как только триггер оказывает на нас воздействие – мы сразу же переключаемся на “автопилот”. Что это значит? Наше самоощущение становится туманным и мы начинаем действовать бессознательно. То есть мы не контролируем своё поведение, а действуем по привычке.

Так как мы не запоминаем и не контролируем действия, которые совершаем в этом туманном состоянии, это может создать нам огромные проблемы в жизни.

Вот несколько примеров этого негативного влияния:

  • Трата больших сумм денег “на эмоциях”. Опытные продавцы-манипуляторы пользуются механизмом запуска различных триггеров у своих клиентов: жадность, страх потери, вызов приятных эмоций по отношению к себе и т.д. Если мы дадим себе возможность принимать решения неосознанно в таких ситуациях – мы можем лишиться большой суммы денег.
  • Разрыв отношений с близким человеком. Если мы поддадимся своим чувствам, вызванными какими-либо стимулами (сплетнями, собственными догадками), то можем поссориться с близкими людьми.
  • Подрыв своего здоровья. Приятные ощущения от еды, наркотиков, алкоголя или сигарет могут отключить наш сознательный контроль над тем, что мы делаем. И это может подорвать наше здоровье. Мы начнём переедать или станем зависимыми от вредных веществ.

Для того чтобы освободиться от воздействия триггеров – ни в коем случае не нужно винить себя. Потому что этот механизм действует автономно – сам по себе. Что нужно, так это внимательно следить за своими внутренними ощущениями и изучать, что оказывает на вас сильное воздействие и включает “автопилот”. Как определить от чего возникает определённая эмоция?

Как работать с дашбордами

Вы увидели несколько примеров дашбордов в нашей статье, но как работать с ними и как применить знания на практике? Давайте разберемся в том, как правильно собрать свой первый дашборд.

Указывайте только важные показатели

Настройте ключевые данные, чтобы они всегда были у вас под рукой, и проверяйте периодически их актуальность и правильность значений.

Создавайте простую и понятную структуру

Каждый показатель и значение в таблице или на диаграмме не должны вызывать разночтений у вас, руководителя, коллеги или у клиента. Если создаете отчет по количеству сотрудников, не добавляйте таблицы с валовой прибылью — создайте два дашборда для разных целей.

Создавайте модули таким образом, чтобы каждый элемент был пропорционален и гармоничен с остальными.

Сравнивайте показатели

Если в дашборде указаны схожие показатели, сделайте рядом сравнительную таблицу или график, где вы сможете видеть динамику этих значений.

Добавьте настройку фильтров и модулей

Когда будете выбирать систему для создания дашбордов проследите, чтобы в ней были фильтры данных по нескольким параметрам: период, сравнение сегментов и добавление условий.

На примере ниже показан модуль «Посетители» в дашборде «Яндекс.Метрика» и его варианты настройки.

Пример модуля в дашборде

Выбирайте наилучшую визуализацию

В случае с дашбордами, созданными через Excel, нет такого большого выбора для визуализации, какой предоставляют, к примеру, Power Bi или Tableau — о них поговорим в следующих разделах

Когда создадите отчет, попробуйте сделать цветовой акцент на основных показателях или колонках в диаграммах так, чтобы любой пользователь понимал, куда нужно посмотреть и на что обратить внимание

Также следите за выбором шрифта — сделайте его четким и большим, так как часто на практике дашборды показывают в ходе планерок на больших экранах.

Придерживайтесь минимализма

После создания дашборда проверьте все значения — нет ли в отчете лишних данных, которые ничего не скажут или никак не помогут проанализировать ситуацию в реальном времени. Если нашли такой показатель, скройте его или уберите с дашборда.

Задавайте вопросы

Если вы видите в показателях резкие изменения — узнайте, в чем причина. Если дашборд не отвечает на ваш вопрос, изучите составляющие модуля, где была ошибка. Откройте источники данных дашборда и просмотрите значения.

Ссылка на задачу JIRA в фиксации кода, ветви, перемещения запроса(request) или просмотра

В приведенной ниже таблице описывается, как ссылаться на задачу JIRA в  фиксации кода, ветви, перемещении запроса(request) или просмотре, чтобы эти события вызывали переходы для задачи (при условии, что вы настроили триггеры на переходы).

Событие

Инструкции

Создание фиксации кода

Включите ключ задачи в сообщение фиксации кода.

Например, сообщение фиксации, подобное этому «Первоначальная фиксация TIS-1», автоматически переместит задачу TIS-1 с «Сделать» на «В разработке».

Создание ветви

Включает ключ задачи в имя ветки при создании ветки.

Например, если вы назовете свою ветку «TIS-2-feature», она автоматически переместит задачу TIS-2 с «Сделать» на «В прогрессе».

Создание / повторное открытие / отклонение на слияние перемещения задачи

Убедитесь, что перемещение запроса(request) включает в себя фиксации, которые ссылаются на задачу (в сообщениях фиксации кода).

Например, если вы создаете перемещение задачи, которая имеет название «TIS-3» в заголовке, он автоматически переводит проблему «TIS-3» с «В процессе» на «В обзоре». Если вы повторно открываете, отклоняете или объединяете перемещение запроса(request), он также будет соответствующим образом переводить задачу «TIS-3».

Запуск / Отклонение / Отказ / Закрытие обзора

Включите ключ задачи в заголовок обзора, когда вы создадите обзор.

Например, если вы назовете свой обзор «TIS-4 New story» и начнете обзор, он автоматически переместит проблему TIS-4 с «В процессе» на «В обзоре». Если вы отклоняете, оставляете или закрываете обзор, он также будет соответствующим образом переводить задачу «TIS-4».

Оповещение о недоступности сайта

Давайте настроим уведомления о проблемах на сайте. Я предлагаю 2 типа оповещения:

  1. О низкой скорости доступа к сайту.
  2. О недоступности сайта вообще.

Идем, как обычно в исходный шаблон, на вкладку Triggers и добавляем новый.

Я предлагаю вот такое условие срабатывания для определения недоступности сайта. Если среднее значение 3-х последних проверок больше, либо равно единице, то срабатывает оповещение о недоступности сайта.

Когда идет 0 во всех проверках, все в порядке. Триггер сработает только если все 3 последних проверки не равны нулю. В моем примере Failed step может принимать значение либо 0, либо 1, где 1 это номер сбойного шага. Если у вас шагов несколько, то сбойным может оказаться второй шаг или третий шаг. То есть значение может быть больше 1. Но в любом случае, если последние 3 значения подряд строго не 0, то идет срабатывание триггера. Операция восстановления очень простая. Если последняя проверка без ошибки, то есть код равен 0, то считаем, что сайт уже работает.

Чтобы проверить работу триггера, достаточно на zabbix server в файл /etc/hosts добавить строку:

127.0.0.1 github.com

и подождать 3 минуты, чтобы получились 3 неудачных проверки. После этого вам должно было отправиться уведомление о недоступности сайта. Я получил вот такое:

Дальше делаем проверку времени ответа сервера. Тут каждый волен настраивать так, как ему кажется более правильным и удобным. Я использую такую схему. Беру среднее время отклика сайта и умножаю его на 3. Далее смотрю последние 7 проверок. Если в 5 проверках среди этих семи были значения выше, чем утроенное среднее время отклика, то считаю, что сайт тормозит и надо слать уведомление. Немного замороченно, но на практике такая схема у меня себя хорошо зарекомендовала без ложных срабатываний. При этом, если возникают реальные проблемы, я их вижу. Рисуем триггер.

Условие восстановления — в последних трех запросах два и более были быстрее, чем утроенное среднее время доступа. Текст выражений для копирования:

{Sites Monitoring:web.test.time.count(#7,1.5,"ge")}>4
{Sites Monitoring:web.test.time.count(#3,1.5,"lt")}>1

В выражении 1.5 это время отклика в секундах. Именно в таком виде оно попадает в zabbix сервер. Проверить можно в Latest Data.

В завершении оставляю свой шаблон, который создал для написания статьи. Можете копированием и редактированием приспособить его для своих сайтов. Это быстрее, чем составлять с нуля. Шаблон экспортирован с версии zabbix 4.0 — sites_monitoring.xml

Вот и все, мониторинг веб сайта работает, авторизация проверяется, оповещение о недоступности сайта настроено. Для полноты картины можно создать Screen или Dashboard с выводом всех необходимых параметров на один экран. Его настройки уже будут зависеть от конкретной ситуации и тех данных, которыми вы располагаете. К примеру, если у вас настроен мониторинг веб сервера, то можно разместить рядом графики его загрузки и параметры доступа к сайту. Туда же можно добавить загрузку самого сервера по процессору и памяти и вывести график использования сетевого интерфейса.

В этом плане Zabbix очень гибок и позволяет настроить все на любой вкус и под любые требования.

Более подробно о мониторинге за временем отклика сайта читайте в отдельной статье на этот счет. Там описана теория процесса и практические рекомендации, вместе с готовым триггером.

Заключение

Добавлю несколько слов, как можно использовать данный мониторинг web сайта. У меня было два хостинга и хотелось выбрать один более быстрый. Загрузка самого сервера по железу была настолько низка, что ее можно было вообще не брать в расчет. Более важным параметром было именно время отклика сервера и скорость доступа к нему. Я запустил сайт на обоих серверах и настроил мониторинг. По его параметрам выбрал более быстрый сервер.

Конечно, тут нужно понимать, что данные подобного мониторинга очень условны и зависят о того, где располагается сам сервер заббикса. Возможна ситуация, когда мониторинг всех сайтов будет показывать примерно одни и те же цифры из-за ограничения самого сервера мониторинга. Нужно иметь это ввиду. Еще достаточно часто при проверке времени отклика сайта появляются большие провалы по времени до 5-10-15 секунд. Это сильно влияет на среднее время доступа. Возникают эти провалы из-за временных сетевых проблем не обязательно на самом сайте. Это тоже нужно учитывать при анализе полученных данных.

В любом случае нужно с головой подходить к анализу данных мониторинга сайта. В большинстве случаев важны не сами значения, а общие тенденции их изменения в сравнении и с другими хостами. Учитывайте это. На этом у меня все.

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
Техноарена
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: