Повышение отказоустойчивости - сетевые карты с режимом bypass [Документация VAS Experts]

Различия

Показаны различия между двумя версиями страницы.

Ссылка на это сравнение

Следующая версия
Предыдущая версия
dpi:dpi_components:platform:by_pass [2021/03/04 11:55] – создано kkatanovdpi:dpi_components:platform:by_pass [2024/09/26 15:29] (текущий) – создано - внешнее изменение 127.0.0.1
Строка 1: Строка 1:
-=====1=====+====== Повышение отказоустойчивости - сетевые карты с режимом bypass ====== 
 +{{indexmenu_n>15}} 
 + 
 +**Почему Вы рекомендуете покупать карты SILICOM?**\\ 
 + Причины следующие: 
 +  * карты обладают функциональностью bypass 
 +  * в комплект поставки можно включить лицензии на требуемые драйвера для максимальной производительности - DPDK & Libzero в маркировке таких карт есть обозначение -SQ1 (пример для 10GbE карты) 
 +**Работает ли байпасс в сетевых картах SILICOM при отключении питания?** 
 +  * Оптический байпасс - работает при отключенном питании (проверено на карте PE210G2BPI9-SR-SQ1 short range/fiber). 
 +  * Медный байпасс - при отключении питания работает (проверено на карте [[http://www.silicom-usa.com/Networking_Bypass_Adapters/PEG6BPi6-Six_Port_Copper_Gigabit_Ethernet_PCI_Express_Bypass_Server_Adapter_Intel_based_58|PEG6BPi6]]) 
 +**Есть ли ручное управление байпасс в сетевых картах SILICOM?**\\ 
 +DPI управляет bypass самостоятельно.\\ 
 +В случае необходимости ручное управление bypass  
 +возможно с помощью утилиты bpctl_util:\\ 
 +  * bpctl_util all get_bypass - получить состояние bypass 
 +  * bpctl_util all set_bypass on - активировать bypass 
 +  * bpctl_util all set_bypass off - деактивировать bypass 
 + 
 +**Проблема: приобрели использованную карту и не работает bypass, что делать?**\\ 
 +Проблема связана с картой перенастроенной в качестве стандартной, то есть с отключенной байпасс функциональностью.\\ 
 +Диагностика:\\ 
 + 
 +  bpctl_util all get_std_nic 
 +  07:00.0 standard 
 +  07:00.1 slave 
 +  07:00.2 standard 
 +  07:00.3 slave 
 +  
 +Должно быть non-standard.\\ \\ 
 +Для установки карты в режим bypass требуется выполнить следующее:\\ 
 +  bpctl_util all set_std_nic off 
 + 
 +Команда переключает режим в не стандартный, то есть с bypass режимом.  
 + 
 +**Пояснение относительно времени переключения bypass?**\\ Включение bypass длится короткий временной интервал около 0.5 с (по умолчанию), но по причинам передоговаривания интерфейсов в итоге может занять больший временной интервал, ниже пояснение относительно переключения bypass от производителя. \\ 
 +Такая длительность переключения может влиять на BGP, OSPF и другие механизмы, за счет кратковременного разрыва связи (продолжительность может варьироваться см. описание ниже) или нескольких разрывов связи как в случае перезагрузки сервера или сервиса ( //сервис ->разрыв->bypass->разрыв-> сервис//), в этом случае время восстановления сессий (BGP, OSPF) зависит от их настроек и может длиться до нескольких десятков секунд. Для уменьшения данного интервала необходимо провести самостоятельно конфигурирование для уменьшения времени восстановления сессий после разрыва связи. **Например**, на оборудовании Juniper настраивается hold-timer down 500ms, что позволяет избежать разрыва BGP сессии и перестройки таблиц маршрутизации: 
 +<code>set interfaces <ifname> hold-time up 500 down 500</code> 
 +где 500 мс таймаут ожидания, прежде чем изменится operational status интерфейса 
 + 
 +  Basically, the time for the bypass mechanism to switch from one mode to another is 10mS. 
 +  The timing that you are seeing relates to re-establish the link and then re-establish  
 +  the connection (with new routing tables in switches and devices). 
 +  This switch to bypass mode is done in our product by physically connecting the pair of  
 +  the ports together (wire to wire). This means that when this happen our product is actually out  
 +  of the picture and the start of the traffic with this new connection will depend on  
 +  the two networking devices (router / switch / device) on how they link together and how  
 +  they establish the connection again. You can try to  force fix mode (not auto-neg,  
 +  change to force 1G FD or so) this might reduce the time needed for the negotiation.  
 +  Not sure how much. 
 +  For the change from bypass mode to normal mode - all the above also stand as well.  
 +  The networking devices (router / switch / device) loss the link with each other and  
 +  starts establish the connection with the Silicom NIC . Here you have more control as  
 +  the link is done between the two devices and your system (Check that all the devices  
 +  are set to the same speed settings) 
 +  From our customer and our experience a 1-3sec is a reasonable time to get the Copper 1G link 
 +  to be establish between 2 network devices. 
 +   
 +**все хорошо кроме того, что один порт на сетевой работает в режиме байпасc и не фильтрует трафик.**\\ 
 + Если в конфиге прописано (in/out_dev), но не переключает, то попробуйте сброс bypass свитча в карте в начальное состояние: 
 +  bpctl_util all set_bypass off 
 +  bpctl_util all set_dis_bypass off 
 +  bpctl_util all set_bypass_pwoff on 
 +  bpctl_util all set_bypass_pwup on 
 +  bpctl_util all set_std_nic off 
 +  bpctl_util all get_bypass_change on 
 +  bpctl_util all get_tx on 
 +  bpctl_util all get_tpl off 
 +  bpctl_util all get_wait_at_pwup off 
 +  bpctl_util all get_hw_reset off 
 +  bpctl_util all get_disc off 
 +  bpctl_util all get_disc_change off 
 +  bpctl_util all get_dis_disc off 
 +  bpctl_util all get_disc_pwup off 
 +  bpctl_util all get_wd_exp_mode bypass 
 +  bpctl_util all get_wd_autoreset disable 
 + Если не помогает, значит дефект карты, меняйте ее по гарантии. 
 +   
 +**Настройка Juniper, чтобы перевод в bypass и обратно не приводил к перестроению маршрутов.**\\ 
 + <code bash>set interfaces <ifname> hold-time up 500 down 500 
 + 
 +show xe-5/2/    
 + description "-= 20G UPLINK LAGG =-"; 
 +hold-time up 1000 down 1000; 
 +gigether-options { 
 + 802.3ad ae1; 
 +}</code> 
 +    
 +**Настройка Cisco, чтобы перевод в bypass и обратно не приводил к перестроению маршрутов.**\\ 
 +  int fa0/0 
 +  ip bgp fast-external-fallover deny    
 + Примечание:  
 +  BGP Fast-external-fallover command terminates external BGP sessions of any directly adjacent peer if the link used to reach the peer goes down; without waiting for the hold-down timer to expire 
 + 
 +**Cписок всех dna интерфейсов и их MAC**\\ 
 +grep ^ /sys/class/net/dna?/address 
 + 
 +**Как проверить, оснащена ли карта bypass**\\ 
 + Проверить наличие bypass можно выполнив команду 
 +  lspci -v|grep -A1 Eth 
 +для карт с bypass в поле Subsystem будет указано 
 +  Subsystem: Silicom Ltd. Device