Skip to content

Мониторинг кластера 1С, отправка данных в prometheus

License

Notifications You must be signed in to change notification settings

LazarenkoA/prometheus_1C_exporter

Repository files navigation

prometheus_1C_exporter

Приложение выполняет роль explorer'а для prometheus. На текущий момент приложение собирает метрики:

  • Используемые клиентские лицензии

  • Доступную производительность серверов приложений

    • в том числе
  • Количество соединений

  • Количество сеансов

  • Текущая память процесса (получается из ОС, пока поддерживается только linux)

  • Общая загрузка ЦПУ (получается из ОС)

  • Метрики диска (получается из ОС, пока только linux)

    • WeightedIO (Это значение подсчитывает количество миллисекунд, в течение которых запросы ввода-вывода ожидали на этом блочном устройстве. Если имеется несколько ожидающих запросов ввода-вывода, это значение будет увеличиваться как произведение количества миллисекунд на количество ожидающих запросов. Например, если 60 запросов на чтение ждут в среднем 30 мс, поле read_time увеличится на 60 * 30 = 1800)
    • IopsInProgress (Это значение подсчитывает количество запросов ввода-вывода, которые были отправлены драйверу устройства, но еще не завершены. Он не включает запросы ввода-вывода, которые находятся в очереди, но еще не отправлены драйверу устройства). Пример настройки дажборда
    • ReadCount (Это значения увеличиваются при завершении запроса ввода-вывода)
    • WriteCount (Это значения увеличиваются при завершении запроса ввода-вывода)
    • IoTime (Это значение подсчитывает количество миллисекунд, в течение которых устройство помещало в очередь запросы ввода-вывода)
  • Проверка галки "блокировка регламентных заданий"

  • Память всего

  • Память текущая

  • Чтение/Запись текущее

  • Время вызова текущее

  • Время вызова СУБД

  • Процессорное время текущее

сборка показателей осуществляется через утилиту rac. Каждую из метрик можно ставить на паузу, например такое может потребоваться в процессе обновления ИБ т.к. соединения RAC могут мешать этому процессу. Что бы поставить на паузу нужно отправить GET запрос

http://host:9091/Pause?metricNames=ProcData,SessionsMemory&offsetMin=1

где metricNames это метрики через запятую, offsetMin это пауза в минутах после которой автоматически включается сбор показателей. offsetMin - необязательный, если его не указывать сбор будет приостановлен будет пока явно его не запустить, запуск производится так:

http://host:9091/Continue?metricNames=ProcData,SessionsMemory

Имена метрик можно посмотреть в конфиге settings.yaml

Начать использовать

  • Скачать актуальный релиз
  • Собрать в ручном режиме. Ставим Go, git clone https://github.com/LazarenkoA/prometheus_1C_exporter, переходим в каталог, выполняем go build -o "1C_exporter" или go build -o "1C_exporter.exe".

Запуск

Linux:

./1C_exporter -port=9095 --settings=/usr/local/bin/settings.yaml

для запуска в качестве службы можно посмотреть пример systemd в каталоге service/linux

Windows:

1C_exporter.exe -port=9095 --settings=C:\settings.yaml

приложение поддерживает работу в режиме службы, пример создания службы можно посмотреть в каталоге service/windows

Если порт не указать по дефолту будет порт 9091

в конфиге прометеуса (prometheus.yml) нужно указать хосты на которых запущен explorer

  - job_name: '1C_Metrics'
    metrics_path: '/1C_Metrics' 
    static_configs:
    - targets: ['host1:9091', 'host2:9091', 'host3:9091', 'host4:9091']

Все, настраиваем дажборды, умиляемся.

Примеры дажбордов

Для данной конфигурации дажбордов (Клиентские лицензии) настройки графаны такие:

  • Создаем новый дажборд
  • Query - prometheus
  • в поле Metrics sum by (licSRV) (ClientLic{quantile="0.99", licSRV=~"(?i).+sys.+"})

экспортер выдает данные в таком виде

.....
ClientLic{host="CA-N11-APP-1",licSRV="\"ca-sys-1\"",quantile="0.5"} 193
ClientLic{host="CA-N11-APP-1",licSRV="\"ca-sys-1\"",quantile="0.9"} 193
ClientLic{host="CA-N11-APP-1",licSRV="\"ca-sys-1\"",quantile="0.99"} 193
ClientLic_sum{host="CA-N11-APP-1",licSRV="\"ca-sys-1\""} 193
ClientLic_count{host="CA-N11-APP-1",licSRV="\"ca-sys-1\""} 1
ClientLic{host="CA-N11-APP-1",licSRV="HASP",quantile="0.5"} 17
ClientLic{host="CA-N11-APP-1",licSRV="HASP",quantile="0.9"} 17
ClientLic{host="CA-N11-APP-1",licSRV="HASP",quantile="0.99"} 17
ClientLic_sum{host="CA-N11-APP-1",licSRV="HASP"} 17
ClientLic_count{host="CA-N11-APP-1",licSRV="HASP"} 1
ClientLic{host="CA-N11-APP-1",licSRV="soft",quantile="0.5"} 4
ClientLic{host="CA-N11-APP-1",licSRV="soft",quantile="0.9"} 4
ClientLic{host="CA-N11-APP-1",licSRV="soft",quantile="0.99"} 4
ClientLic_sum{host="CA-N11-APP-1",licSRV="soft"} 4
ClientLic_count{host="CA-N11-APP-1",licSRV="soft"} 1
.....

это можно проверить выполнив curl http://localhost:9091/1C_Metrics

соответственно в примере sum by (licSRV) (ClientLic{quantile="0.99", licSRV=~"(?i).+sys.+"}) мы берем метрику ClientLic ту где quantile="0.99" и licSRV подходит к regexp "(?i).+sys.+" Другие дажборды настраиваются по аналогии. Другие примеры функций можно посмотреть в документации prometheus

Пример настройки графаны для дажборда по IOPS диска

sum(disk{ node="$group", host=~"(?i).*app-1", quantile="0.99", metrics="IopsInProgress"})by (metrics)

Ожидание на диске

sum(rate(disk{ node="$group", host=~"(?i).*app-2", quantile="0.99", metrics="WeightedIO"}[5m])) by (metrics)