Содержание

Компоненты и метрики

Покрытие мониторингом

flowchart LR EXP["fast-epdg
/metrics :9817"] EXP --> CFG["Config
2 метрики"] EXP --> NET["Network
1 метрика"] EXP --> PROTO["Protocols L5-L7
15 метрик"] EXP --> SVC["Service KPI
4 метрики"] EXP --> SESS["Session State
4 метрики"] EXP --> APP["Application
3 метрики"] EXP --> SYS["System
4 метрики"] PROTO --> IKEV2["IKEv2
SWu — 3"] PROTO --> GTPC["GTPv2-C
S2b — 4"] PROTO --> GTPU["GTP-U
S2b data — 3"] PROTO --> DIA["Diameter
SWm/SWx/S6b — 5"]

Количественный обзор по категориям

Категория Кол-во метрик Интервал опроса Ключевые показатели
Config 2 10 с Статус конфигурации, счётчик reload
Network 1 10 с Статус соединений с узлами (PGW/AAA/HSS)
IKEv2 (SWu) 3 10 с Сообщения по типам (IKE_SA_INIT, IKE_AUTH, CREATE_CHILD_SA), диаграмма задержки, ошибки
GTPv2-C (S2b) 4 10 с Сообщения (Create/Modify/Delete Session), задержки, ошибки, ретрансляции
GTP-U data plane 3 10 с Packets/bytes, ошибки туннелирования
Diameter (SWm/SWx/S6b) 5 10 с Сообщения по command code (DER/DEA, MAR/MAA, AAR/AAA), задержки, ошибки, watchdog, статус соединения
Service KPI 4 10 с Процент успешных попыток, гистограмма продолжительности, доступность сервиса, время безотказной работы
Session State 4 10 с IKE SA, Child SA, GTP-сессии, всего пользователей
Application 3 10 с Количество потоков, память, лог-сообщения по уровням
System 4 10 с Утилизация CPU, память, утилизация памяти, открытые FD
Итого 33 метрики

Принципы именования

Все метрики имеют префикс epdg_ и организованы по иерархии:

epdg_
├── config_*           # Конфигурация
├── network_*          # Сетевой уровень
├── ikev2_*            # SWu (IKEv2/IPSec)
├── gtp_*              # S2b control-plane GTPv2-C
├── gtpu_*             # S2b data-plane GTP-U
├── diameter_*         # SWm/SWx/S6b
├── service_*          # KPI сервисов (attach, availability, uptime)
├── session_*          # Состояние сессий (IKE SA, Child SA, GTP, subscribers)
├── app_*              # Метрики приложения (memory, threads, logs)
└── system_*           # Системные метрики (CPU, disk, network)