Повышение отказоустойчивости - сетевые карты с режимом bypass [Документация VAS Experts]

Различия

Показаны различия между двумя версиями страницы.

Ссылка на это сравнение

Предыдущая версия справа и слеваПредыдущая версия
dpi:dpi_components:platform:by_pass [2021/03/04 11:56] – удалено kkatanovdpi:dpi_components:platform:by_pass [2024/09/26 15:29] (текущий) – создано - внешнее изменение 127.0.0.1
Строка 1: Строка 1:
 +====== Повышение отказоустойчивости - сетевые карты с режимом bypass ======
 +{{indexmenu_n>15}}
  
 +**Почему Вы рекомендуете покупать карты SILICOM?**\\
 + Причины следующие:
 +  * карты обладают функциональностью bypass
 +  * в комплект поставки можно включить лицензии на требуемые драйвера для максимальной производительности - DPDK & Libzero в маркировке таких карт есть обозначение -SQ1 (пример для 10GbE карты)
 +**Работает ли байпасс в сетевых картах SILICOM при отключении питания?**
 +  * Оптический байпасс - работает при отключенном питании (проверено на карте PE210G2BPI9-SR-SQ1 short range/fiber).
 +  * Медный байпасс - при отключении питания работает (проверено на карте [[http://www.silicom-usa.com/Networking_Bypass_Adapters/PEG6BPi6-Six_Port_Copper_Gigabit_Ethernet_PCI_Express_Bypass_Server_Adapter_Intel_based_58|PEG6BPi6]])
 +**Есть ли ручное управление байпасс в сетевых картах SILICOM?**\\
 +DPI управляет bypass самостоятельно.\\
 +В случае необходимости ручное управление bypass 
 +возможно с помощью утилиты bpctl_util:\\
 +  * bpctl_util all get_bypass - получить состояние bypass
 +  * bpctl_util all set_bypass on - активировать bypass
 +  * bpctl_util all set_bypass off - деактивировать bypass
 +
 +**Проблема: приобрели использованную карту и не работает bypass, что делать?**\\
 +Проблема связана с картой перенастроенной в качестве стандартной, то есть с отключенной байпасс функциональностью.\\
 +Диагностика:\\
 +
 +  bpctl_util all get_std_nic
 +  07:00.0 standard
 +  07:00.1 slave
 +  07:00.2 standard
 +  07:00.3 slave
 + 
 +Должно быть non-standard.\\ \\
 +Для установки карты в режим bypass требуется выполнить следующее:\\
 +  bpctl_util all set_std_nic off
 +
 +Команда переключает режим в не стандартный, то есть с bypass режимом. 
 +
 +**Пояснение относительно времени переключения bypass?**\\ Включение bypass длится короткий временной интервал около 0.5 с (по умолчанию), но по причинам передоговаривания интерфейсов в итоге может занять больший временной интервал, ниже пояснение относительно переключения bypass от производителя. \\
 +Такая длительность переключения может влиять на BGP, OSPF и другие механизмы, за счет кратковременного разрыва связи (продолжительность может варьироваться см. описание ниже) или нескольких разрывов связи как в случае перезагрузки сервера или сервиса ( //сервис ->разрыв->bypass->разрыв-> сервис//), в этом случае время восстановления сессий (BGP, OSPF) зависит от их настроек и может длиться до нескольких десятков секунд. Для уменьшения данного интервала необходимо провести самостоятельно конфигурирование для уменьшения времени восстановления сессий после разрыва связи. **Например**, на оборудовании Juniper настраивается hold-timer down 500ms, что позволяет избежать разрыва BGP сессии и перестройки таблиц маршрутизации:
 +<code>set interfaces <ifname> hold-time up 500 down 500</code>
 +где 500 мс таймаут ожидания, прежде чем изменится operational status интерфейса
 +
 +  Basically, the time for the bypass mechanism to switch from one mode to another is 10mS.
 +  The timing that you are seeing relates to re-establish the link and then re-establish 
 +  the connection (with new routing tables in switches and devices).
 +  This switch to bypass mode is done in our product by physically connecting the pair of 
 +  the ports together (wire to wire). This means that when this happen our product is actually out 
 +  of the picture and the start of the traffic with this new connection will depend on 
 +  the two networking devices (router / switch / device) on how they link together and how 
 +  they establish the connection again. You can try to  force fix mode (not auto-neg, 
 +  change to force 1G FD or so) this might reduce the time needed for the negotiation. 
 +  Not sure how much.
 +  For the change from bypass mode to normal mode - all the above also stand as well. 
 +  The networking devices (router / switch / device) loss the link with each other and 
 +  starts establish the connection with the Silicom NIC . Here you have more control as 
 +  the link is done between the two devices and your system (Check that all the devices 
 +  are set to the same speed settings)
 +  From our customer and our experience a 1-3sec is a reasonable time to get the Copper 1G link
 +  to be establish between 2 network devices.
 +  
 +**все хорошо кроме того, что один порт на сетевой работает в режиме байпасc и не фильтрует трафик.**\\
 + Если в конфиге прописано (in/out_dev), но не переключает, то попробуйте сброс bypass свитча в карте в начальное состояние:
 +  bpctl_util all set_bypass off
 +  bpctl_util all set_dis_bypass off
 +  bpctl_util all set_bypass_pwoff on
 +  bpctl_util all set_bypass_pwup on
 +  bpctl_util all set_std_nic off
 +  bpctl_util all get_bypass_change on
 +  bpctl_util all get_tx on
 +  bpctl_util all get_tpl off
 +  bpctl_util all get_wait_at_pwup off
 +  bpctl_util all get_hw_reset off
 +  bpctl_util all get_disc off
 +  bpctl_util all get_disc_change off
 +  bpctl_util all get_dis_disc off
 +  bpctl_util all get_disc_pwup off
 +  bpctl_util all get_wd_exp_mode bypass
 +  bpctl_util all get_wd_autoreset disable
 + Если не помогает, значит дефект карты, меняйте ее по гарантии.
 +  
 +**Настройка Juniper, чтобы перевод в bypass и обратно не приводил к перестроению маршрутов.**\\
 + <code bash>set interfaces <ifname> hold-time up 500 down 500
 +
 +show xe-5/2/   
 + description "-= 20G UPLINK LAGG =-";
 +hold-time up 1000 down 1000;
 +gigether-options {
 + 802.3ad ae1;
 +}</code>
 +   
 +**Настройка Cisco, чтобы перевод в bypass и обратно не приводил к перестроению маршрутов.**\\
 +  int fa0/0
 +  ip bgp fast-external-fallover deny   
 + Примечание: 
 +  BGP Fast-external-fallover command terminates external BGP sessions of any directly adjacent peer if the link used to reach the peer goes down; without waiting for the hold-down timer to expire
 +
 +**Cписок всех dna интерфейсов и их MAC**\\
 +grep ^ /sys/class/net/dna?/address
 +
 +**Как проверить, оснащена ли карта bypass**\\
 + Проверить наличие bypass можно выполнив команду
 +  lspci -v|grep -A1 Eth
 +для карт с bypass в поле Subsystem будет указано
 +  Subsystem: Silicom Ltd. Device