Перечень метрик [Документация VAS Experts]

Перечень метрик

Все метрики экспортируются через единый /metrics endpoint в текстовом формате Prometheus. Именование следует правилам Prometheus: epdg_<группа>_<имя>[_unit], тип Counter имеет суффикс _total, Histogram — суффикс _seconds / _bytes.

1. Config (2)

Имя Тип Назначение
epdg_config_status Gauge Статус конфигурации компонента (0=error, 1=ok)
epdg_config_reload_total Counter Счётчик конфигурационных загрузок (success/failure)

2. Network (1)

Имя Тип Назначение
epdg_network_connection_status Gauge Статус TCP/UDP-соединения к узлу (0=down, 1=up) — применяется к PGW (S2b), AAA (SWm), HSS (SWx)

3. IKEv2 SWu (3)

Имя Тип Назначение
epdg_ikev2_messages_total Counter Счётчик IKEv2 сообщений (IKE_SA_INIT / IKE_AUTH / CREATE_CHILD_SA / INFORMATIONAL)
epdg_ikev2_request_duration_seconds Histogram Распределение времени ответа на запросы IKEv2
epdg_ikev2_errors_total Counter IKEv2 ошибки (NO_PROPOSAL_CHOSEN, AUTHENTICATION_FAILED, INVALID_SYNTAX и т.д.)

4. GTPv2-C S2b (4)

Имя Тип Назначение
epdg_gtp_messages_total Counter Сообщения GTPv2-C (Create/Modify/Delete Session, Echo)
epdg_gtp_request_duration_seconds Histogram Время ожидания запрос → ответ
epdg_gtp_errors_total Counter GTP-C ошибки по Cause Code
epdg_gtp_retransmissions_total Counter Перенаправление GTP-C запросов

5. GTP-U data plane (3)

Имя Тип Назначение
epdg_gtpu_packets_total Counter Пакеты через GTP-U туннель (uplink/downlink)
epdg_gtpu_bytes_total Counter Байты через GTP-U туннель
epdg_gtpu_errors_total Counter Ошибки туннелирования (TEID mismatch, decap fail)

6. Diameter SWm/SWx/S6b (5)

Имя Тип Назначение
epdg_diameter_messages_total Counter DER/DEA (SWm), MAR/MAA (SWx), AAR/AAA (S6b), STR/STA
epdg_diameter_request_duration_seconds Histogram Время ожидания запрос → ответ по Diameter
epdg_diameter_errors_total Counter Ошибки по Experimental-Result-Code
epdg_diameter_watchdog_status Gauge Статус DWR/DWA watchdog до узла (0=timeout, 1=ok)
epdg_diameter_connection_status Gauge Статус соединения по Diameter до узла (0=disconnected, 1=connected)

7. Service KPI (4)

Имя Тип Назначение
epdg_service_attach_total Counter Попытки соединения (success/failure) по APN
epdg_service_attach_duration_seconds Histogram Длительность соединения (IKE_SA_INIT → session ready)
epdg_service_availability Gauge Флаг доступности (0=down, 1=up)
epdg_service_uptime_seconds Gauge Время доступности сервиса

8. Session State (4)

Имя Тип Назначение
epdg_session_ike_sa_total Gauge Активные IKE SA
epdg_session_child_sa_total Gauge Активные Child SA (IPSec tunnels)
epdg_session_gtp_sessions_total Gauge Активные GTP-C сессии на S2b
epdg_session_subscribers_total Gauge Уникальные абоненты (подключённые UE)

9. Application (3)

Имя Тип Назначение
epdg_app_threads_total Gauge Общее число рабочих потоков
epdg_app_memory_bytes Gauge Память процесса по типам
epdg_app_log_messages_total Counter Лог-сообщения по уровням (debug/info/warn/error/fatal)

10. System (4)

Имя Тип Назначение
epdg_system_cpu_usage_percent Gauge Загрузка CPU
epdg_system_memory_bytes Gauge Системная память
epdg_system_disk_bytes Gauge Дисковое пространство
epdg_system_open_fds Gauge Открытые описания файлов

Типы метрик (напоминание)

Тип Назначение
Counter Монотонно растущий счётчик (сообщения, ошибки, перезагрузки)
Gauge Текущее значение (активные сессии, память, статус)
Histogram Распределение значений с автоматическими срезами по интервалам (длительность, время жизни)

Была ли полезна эта информация?