Вопросы администрирования [Документация VAS Experts]

Различия

Показаны различия между двумя версиями страницы.

Ссылка на это сравнение

Предыдущая версия справа и слеваПредыдущая версия
Следующая версия
Предыдущая версия
dpi:faq:fastdpi:administrator:start [2024/07/29 14:03] elena.krasnobryzhdpi:faq:fastdpi:administrator:start [Дата неизвестна] (текущий) – удалено - внешнее изменение (Дата неизвестна) 127.0.0.1
Строка 1: Строка 1:
-====== Вопросы администрирования ====== 
-{{indexmenu_n>5}} 
- 
-<accordion autoclose> 
-<accordion-item title="Как узнать текущий релиз (ССС)?"> 
-Командой <code bash>fastdpi -re</code> 
-</accordion-item> 
- 
-<accordion-item title="Как узнать текущую версию?"> 
-Командой <code bash>fastdpi -ve</code> 
-</accordion-item> 
- 
-<accordion-item title="Как откатиться на предыдущую версию?"> 
-Пример отката с 2.7 версии на 2.6: <code bash>yum downgrade fastdpi-2.6</code> 
-</accordion-item> 
- 
-<accordion-item title="В логе нашел ошибку "error loading DSCP settings, res=-4""> 
-Ошибка выводится из-за отсутствия DSCP по автономным системам. Можно проигнорировать. 
-</accordion-item> 
- 
-<accordion-item title="Не всегда все команды обрабатываются и выдается ошибка ERROR : Can't connect to 127.0.0.1:29000, errcode=99 : Cannot assign requested address Autodetected fastdpi params : dev='lo', port=29000 connecting 127.0.0.1:29000 ...Есть подозрение, что наш способ загрузки абонентов в скат не совсем для него хорош (мы загружаем отдельно каждого абонента, что приводит к >50000 команд при первичной инициализации, которую мы еще раз в сутки проводим на всякий случай)"> 
-fdpi_ctrl для общения с dpi использует обычный linux стек, так что рекомендации по тюнингу аналогичны как для web серверов (типа nginx) под высокой нагрузкой\\ 
- 
-Настройки подобны для nginx, которые рекомендуют вставить в файл /etc/sysctl.conf (для того чтобы они сохранились при перезагрузке)\\ 
- 
-  # Оптимизация работы сетевого стека ОС 
-  net.core.netdev_max_backlog=10000 
-  net.core.somaxconn=262144 
-  net.ipv4.tcp_syncookies=1 
-  net.ipv4.tcp_max_syn_backlog = 262144 
-  net.ipv4.tcp_max_tw_buckets = 720000 
-  net.ipv4.tcp_tw_recycle = 1 
-  net.ipv4.tcp_timestamps = 1 
-  net.ipv4.tcp_tw_reuse = 1 
-  net.ipv4.tcp_fin_timeout = 30 
-  net.ipv4.tcp_keepalive_time = 1800 
-  net.ipv4.tcp_keepalive_probes = 7 
-  net.ipv4.tcp_keepalive_intvl = 30 
-  net.core.wmem_max = 33554432 
-  net.core.rmem_max = 33554432 
-  net.core.rmem_default = 8388608 
-  net.core.wmem_default = 4194394 
-  net.ipv4.tcp_rmem = 4096 8388608 16777216 
-  net.ipv4.tcp_wmem = 4096 4194394 16777216 
- 
-для 1Гбит интерфейса:\\ 
-   net.core.netdev_max_backlog=10000 
-для 10Гбит интерфейса:\\ 
-   net.core.netdev_max_backlog=30000 
- 
-Чтобы не делать ребут их можно изменить на лету, применив команду 
-sysctl -w настройка, например, sysctl -w net.ipv4.tcp_tw_reuse=1\\ 
- 
-Это должно решить проблему\\ 
- 
-**Для CentOS 7.* **\\ 
-пример: 
-  # Оптимизация работы сетевого стека ОС 
-  net.core.netdev_max_backlog=65536 
-  net.core.optmem_max=25165824 
-  net.core.somaxconn=1024 
-  net.ipv4.tcp_max_orphans = 60000 
-  net.ipv4.tcp_no_metrics_save = 1 
-  net.ipv4.tcp_window_scaling = 1 
-  net.ipv4.tcp_timestamps = 1 
-  net.ipv4.tcp_sack = 1 
-  net.ipv4.tcp_syncookies=1 
-  net.ipv4.tcp_max_syn_backlog = 262144 
-  net.ipv4.tcp_max_tw_buckets = 720000 
-  net.ipv4.tcp_tw_recycle = 1 
-  net.ipv4.tcp_timestamps = 1 
-  net.ipv4.tcp_tw_reuse = 1 
-  net.ipv4.tcp_fin_timeout = 30 
-  net.ipv4.tcp_keepalive_time = 1800 
-  net.ipv4.tcp_keepalive_probes = 7 
-  net.ipv4.tcp_keepalive_intvl = 30 
-  net.core.wmem_max = 33554432 
-  net.core.rmem_max = 33554432 
-  net.core.rmem_default = 8388608 
-  net.core.wmem_default = 4194394 
-  net.ipv4.tcp_rmem = 4096 8388608 16777216 
-  net.ipv4.tcp_wmem = 4096 4194394 16777216 
- 
-команда обновления: 
-  sysctl –system 
-[[https://christophermonzon.wordpress.com/2016/10/04/centos-7-network-performance/|Дополнительная информация CentOS7]] 
- 
- 
- 
-[[http://www.vasexperts.ru/upload/SCESM2СКАТ.zip|Cкрипты для миграции из SCE SM в БД СКАТ, описание внутри]] 
-</accordion-item> 
- 
-<accordion-item title="Как посмотреть загрузку по ядрам и почему они загружены неравномерно"> 
- Для просмотра загрузки процессора по ядрам в утилите top нажмите 1 
- Для просмотра загрузки по задачам dpi выполните команду 
-  ps -p `pidof fastdpi` H -o %cpu,lwp,pri,psr,comm 
-** Пример** вывода: 
-<code bash>  %CPU   LWP PRI PSR COMMAND 
- 0.0  23141  41   0 fastdpi_main 
- 0.0  23146  41   0 fastdpi_dl 
- 0.3  23147  41   0 fastdpi_ctrl 
- 35.8 23148  41   0 fastdpi_ajb 
- 32.7 23152  41   1 fastdpi_rx_1 
- 34.1 23165  41   2 fastdpi_wrk0 
- 34.1 23170  41   3 fastdpi_wrk1</code> 
- В dpi задачи COMMAND функционально разделены по ядрам PSR, чтобы не мешать работе друг друга:\\ 
- - потоки wrk выполняют анализ данных в сетевых пакетах\\ 
- - поток rx ответственен за транзит данных между сетевыми портами\\ 
- - остальные потоки выполняют прикладные и вспомогательные задачи (генерация netflow, прием управляющих команд, загрузка списков, запись pcap и т.п.) и могут создавать пиковые нагрузки на CPU, поэтому вынесены на отдельное ядро 
-</accordion-item> 
- 
-<accordion-item title="Получили ошибку в fastdpi_alert.log, что делать? [CRITICAL][2017/10/06-16:36:44:616019][0x7fdb297ac700] metadata_storage : Can't allocate memory [repeat 1], cntr=188889, allocated=188889"> 
-В DPI все предварительно аллоцировано, по умолчанию на данное к-во абонентов.  
- Это регулируется параметром в конфигурации, mem_ip_metadata_recs.  
- **Например** для увеличения до 500000 абонентов поставьте в конфигурации /etc/dpi/fastdpi.conf: 
-  mem_ip_metadata_recs=500000 
-  потребуется рестарт 
-  service fastdpi restart 
-</accordion-item> 
- 
-<accordion-item title="Какие файлы рекомендуете архивировать?"> 
-  cp /etc/pf_ring/ /BACKUPDIR/pf_ring  
-  cp /etc/dpi /BACKUPDIR/etc/ 
-  mdb_copy /var/db/dpi /BACKUPDIR/db/ 
-  (с mdb_copy можно делать бекап при работающем fastdpi) 
-</accordion-item> 
- 
-<accordion-item title="ipmi ест 100% cpu, мешает работе dpi"> 
-  echo 100 > /sys/module/ipmi_si/parameters/kipmid_max_busy_us 
-  чтобы настройка не потерялась при перезагрузке сервера эту команду можно добавить в /etc/rc.local 
-</accordion-item> 
- 
-<accordion-item title="Ошибка в алерт логе [ERROR   ] bpm : thread #1 - does not change self-monitoring counters, и dpi рестартовал и образовалась корка (или перешел в bypass)"> 
- dpi в процессе работы производит самодиагностику и если один рабочих потоков завис и больше не может проводить обработку трафика, то dpi детектирует это состояние и перезапускается с генерацией корки по сигналу Abort\\ 
-<note important>**Важно:** trace и dbg настройки в fastdpi.conf предназначены для диагностики и отладки, а не для постоянной работы, в частности:\\ 
- если запись на диск заблокирована другим процессом (например ротацией логов, которая обычно происходит в период с 3 до 4 утра ), то при включенной трассировке может произойти блокировка рабочего потока на записи в диагностический (slave) лог и переход dpi в bypass или его рестарт, поэтому после завершения диагностики не забудьте эти настройки отключить. </note> 
- Проблема проявляется только на некоторых серверах и если ваш сервер попал в это число, то рекомендуем изменение стандартного дискового планировщика на deadline:  
-<code bash>echo deadline > /sys/block/sda/queue/scheduler 
-echo deadline > /sys/block/sdb/queue/scheduler</code>  
-</accordion-item> 
- 
-<accordion-item title="Почему в процессе работы растет память, потребляемая процессом"> 
- dpi выделяет память статически: при старте процесса и в момент создания некоторых профилей услуг (таких как NAT, черные и белые списки), в процессе работы дополнительная память не выделяется почему же тогда растет потребление?\\ 
- ОС Linux различает резидентную (обозначена в top как RES) и виртуальную (обозначена в top VIRT) память процесса, особенность в том, что пока память не инициализирована (фактически инициализирована нулем), то она не записывается linux в резидентную и перемещается туда по мере ее инициализации\\ 
- Настройкой mem_preset=1 в /etc/dpi/fastdpi.conf можно указать, чтобы dpi инициализировал всю выделенную память (точнее почти всю), тогда размер резидентной части не будет расти по мере работы, но этот вариант замедляет старт и хорош когда физической оперативной памяти достаточно, поэтому лучше просто учитывать этот фактор и следить отдельно за расходом виртуальной памяти (VIRT) и резидентной (RES).  
-</accordion-item> 
- 
-<accordion-item title="можете подсказать, на одном из скатов много зомби процессов с именами wd_*, только рестарт поможет?"> 
-<code bash> 
-166206 ?        Z      0:00  \_ [wd_fastdpi.sh] <defunct> 
-166219 ?        Z      0:00  \_ [wd_fastpcrf.sh] <defunct> 
-</code> 
- достаточно перезапустить watchdog 
-  service watchdog restart 
-</accordion-item> 
- 
-<accordion-item title="Проблема детектирования протоколов или сигнатур"> 
-В случае проблем детектирования протоколов или сигнатур необходимо выполнить по три теста на каждом из перечисленных устройств:  
-  * персональный компьютер 
-  * смартфон на операционной системе IOS 
-  * смартфон на операционной системе Android 
- 
-Следующие рекомендации позволят избавиться от лишнего трафика: 
-  * тест на ПК рекомендуется проводить в браузере в режиме инкогнито 
-  * выполняя тест на смартфоне, необходимо включить на нем режим экономии энергии 
-</accordion-item> 
- 
-<accordion-item title="Выполнение теста:"> 
-  - Проверьте, включены ли в файле /etc/dpi/fastdpi.conf такие параметры, как: <code> 
-trace_ip=“ip абонента” 
-ajb_save_ip=“ip абонента” 
-plc_trace_ip=“ip абонента” 
-</code> Если какой-то из этих параметров включен – закомментируйте его и сделайте ''service fastdpi reload''. 
-  - Выполните команду <code>find /var/log/dpi -type f -name "fastdpi_slave_*.log" -exec sh -c 'cat /dev/null > {}'  \;</code> Команда должна удалить данные из файлов fastdpi_slave_*.log. 
-  - Очистите все файлы из /var/dump/dpi/. 
-  - Откройте в текстовом редакторе файл /etc/dpi/fastdpi.conf. Добавьте в файл параметры: <code> 
-trace_ip=“ip абонента” 
-ajb_save_ip=“ip абонента” 
-plc_trace_ip=“ip абонента” – Для работы этого параметра на тестовом абоненте должен быть установлен профиль полисинга 
-</code> 
-  - Подготовьте тестового абонента к запуску, чтобы сгенерировать проблемный трафик. 
-  - Сделайте ''service fastdpi reload''. 
-  - Начните генерировать трафик. Записывайте трафик в течение 1 минуты. 
-  - Откройте файл fastdpi.conf. Закомментируйте параметры: <code> 
-trace_ip=“ip абонента” 
-ajb_save_ip=“ip абонента” 
-plc_trace_ip=“ip абонента” 
-</code> 
-  - Сделайте ''service fastdpi reload''. 
-  - Подготовьте вывод следующих команд в файлы: <code> 
-“fastdpi -ve” 
-“dscp2lst /etc/dpi/protocols.dscp” 
-“fdpi_ctrl list --policing --ip “ip абонента” 
-“dscp2as /etc/dpi/asnum.dscp”. 
-</code> 
-  - Подготовьте архив с файлами из пункта 10, а также с файлом fastdpi.conf. \\ Из /var/log/dpi — fastdpi_stat.log, fastdpi_slave_*.log. \\ Из /var/dump/dpi — udp_*.pcap. 
-  - Повторите необходимое количество тестов с разными устройствами. В названии архива или в самом архиве в файле readme.txt обозначьте, на каких типах устройств проходили тесты. 
-  - Прикрепите архивы к тикету. Если архивы получились слишком большие – загрузите их на любой облачный файлообменник и пришлите нам ссылку. 
-</accordion-item> 
-</accordion> 
- 
-