Перечень метрик
Все метрики экспортируются через единый /metrics endpoint в текстовом формате Prometheus. Именование следует правилам Prometheus: epdg_<группа>_<имя>[_unit], тип Counter имеет суффикс _total, Histogram — суффикс _seconds / _bytes.
1. Config (2)
| Имя | Тип | Назначение |
|---|---|---|
epdg_config_status | Gauge | Статус конфигурации компонента (0=error, 1=ok) |
epdg_config_reload_total | Counter | Счётчик конфигурационных загрузок (success/failure) |
2. Network (1)
| Имя | Тип | Назначение |
|---|---|---|
epdg_network_connection_status | Gauge | Статус TCP/UDP-соединения к узлу (0=down, 1=up) — применяется к PGW (S2b), AAA (SWm), HSS (SWx) |
3. IKEv2 SWu (3)
| Имя | Тип | Назначение |
|---|---|---|
epdg_ikev2_messages_total | Counter | Счётчик IKEv2 сообщений (IKE_SA_INIT / IKE_AUTH / CREATE_CHILD_SA / INFORMATIONAL) |
epdg_ikev2_request_duration_seconds | Histogram | Распределение времени ответа на запросы IKEv2 |
epdg_ikev2_errors_total | Counter | IKEv2 ошибки (NO_PROPOSAL_CHOSEN, AUTHENTICATION_FAILED, INVALID_SYNTAX и т.д.) |
4. GTPv2-C S2b (4)
| Имя | Тип | Назначение |
|---|---|---|
epdg_gtp_messages_total | Counter | Сообщения GTPv2-C (Create/Modify/Delete Session, Echo) |
epdg_gtp_request_duration_seconds | Histogram | Время ожидания запрос → ответ |
epdg_gtp_errors_total | Counter | GTP-C ошибки по Cause Code |
epdg_gtp_retransmissions_total | Counter | Перенаправление GTP-C запросов |
5. GTP-U data plane (3)
| Имя | Тип | Назначение |
|---|---|---|
epdg_gtpu_packets_total | Counter | Пакеты через GTP-U туннель (uplink/downlink) |
epdg_gtpu_bytes_total | Counter | Байты через GTP-U туннель |
epdg_gtpu_errors_total | Counter | Ошибки туннелирования (TEID mismatch, decap fail) |
6. Diameter SWm/SWx/S6b (5)
| Имя | Тип | Назначение |
|---|---|---|
epdg_diameter_messages_total | Counter | DER/DEA (SWm), MAR/MAA (SWx), AAR/AAA (S6b), STR/STA |
epdg_diameter_request_duration_seconds | Histogram | Время ожидания запрос → ответ по Diameter |
epdg_diameter_errors_total | Counter | Ошибки по Experimental-Result-Code |
epdg_diameter_watchdog_status | Gauge | Статус DWR/DWA watchdog до узла (0=timeout, 1=ok) |
epdg_diameter_connection_status | Gauge | Статус соединения по Diameter до узла (0=disconnected, 1=connected) |
7. Service KPI (4)
| Имя | Тип | Назначение |
|---|---|---|
epdg_service_attach_total | Counter | Попытки соединения (success/failure) по APN |
epdg_service_attach_duration_seconds | Histogram | Длительность соединения (IKE_SA_INIT → session ready) |
epdg_service_availability | Gauge | Флаг доступности (0=down, 1=up) |
epdg_service_uptime_seconds | Gauge | Время доступности сервиса |
8. Session State (4)
| Имя | Тип | Назначение |
|---|---|---|
epdg_session_ike_sa_total | Gauge | Активные IKE SA |
epdg_session_child_sa_total | Gauge | Активные Child SA (IPSec tunnels) |
epdg_session_gtp_sessions_total | Gauge | Активные GTP-C сессии на S2b |
epdg_session_subscribers_total | Gauge | Уникальные абоненты (подключённые UE) |
9. Application (3)
| Имя | Тип | Назначение |
|---|---|---|
epdg_app_threads_total | Gauge | Общее число рабочих потоков |
epdg_app_memory_bytes | Gauge | Память процесса по типам |
epdg_app_log_messages_total | Counter | Лог-сообщения по уровням (debug/info/warn/error/fatal) |
10. System (4)
| Имя | Тип | Назначение |
|---|---|---|
epdg_system_cpu_usage_percent | Gauge | Загрузка CPU |
epdg_system_memory_bytes | Gauge | Системная память |
epdg_system_disk_bytes | Gauge | Дисковое пространство |
epdg_system_open_fds | Gauge | Открытые описания файлов |
Типы метрик (напоминание)
| Тип | Назначение |
|---|---|
| Counter | Монотонно растущий счётчик (сообщения, ошибки, перезагрузки) |
| Gauge | Текущее значение (активные сессии, память, статус) |
| Histogram | Распределение значений с автоматическими срезами по интервалам (длительность, время жизни) |
Была ли полезна эта информация?