A solução de “Micro Burst” no cenário de aplicação de captura de tráfego de rede de bypass

No cenário típico de aplicação NPB, o problema mais problemático para os administradores é a perda de pacotes causada pelo congestionamento de pacotes espelhados e redes NPB. A perda de pacotes no NPB pode causar os seguintes sintomas típicos em ferramentas de análise de back-end:

- Um alarme é gerado quando o indicador de monitoramento de desempenho do serviço APM diminui e a taxa de sucesso da transação diminui

- O alarme de exceção do indicador de monitoramento de desempenho da rede NPM é gerado

- O sistema de monitoramento de segurança não consegue detectar ataques à rede devido à omissão de eventos

- Eventos de auditoria de comportamento de perda de serviço gerados pelo sistema de auditoria de serviço

... ...

Como sistema centralizado de captura e distribuição para monitoramento do Bypass, a importância do NPB é evidente. Ao mesmo tempo, a maneira como ele processa o tráfego de pacotes de dados é bastante diferente do tradicional switch de rede ativa, e a tecnologia de controle de congestionamento de tráfego de muitas redes ativas de serviço não é aplicável ao NPB. Como resolver a perda de pacotes NPB, vamos começar com a análise da causa raiz da perda de pacotes para ver isso!

Análise da causa raiz do congestionamento de perda de pacotes NPB/TAP

Em primeiro lugar, analisamos o caminho de tráfego real e a relação de mapeamento entre o sistema e a entrada e saída da rede NPB de nível 1 ou nível. Não importa que tipo de topologia de rede o NPB forme, como sistema de coleta, há uma relação de entrada e saída de tráfego muitos-para-muitos entre o "acesso" e a "saída" de todo o sistema.

Micro Explosão 1

Em seguida, analisamos o modelo de negócios do NPB da perspectiva dos chips ASIC em um único dispositivo:

Micro Explosão 2

Recurso 1: O "tráfego" e a "taxa de interface física" das interfaces de entrada e saída são assimétricos, resultando em um grande número de micro-rajadas é um resultado inevitável. Em cenários típicos de agregação de tráfego muitos para um ou muitos para muitos, a taxa física da interface de saída geralmente é menor que a taxa física total da interface de entrada. Por exemplo, 10 canais de coleta 10G e 1 canal de saída 10G; Num cenário de implantação multinível, todos os NPBBS podem ser vistos como um todo.

Recurso 2: Os recursos de cache do chip ASIC são muito limitados. Em termos do chip ASIC comumente usado atualmente, o chip com capacidade de troca de 640 Gbps possui um cache de 3 a 10 Mbytes; Um chip com capacidade de 3,2 Tbps possui um cache de 20 a 50 mbytes. Incluindo BroadCom, Barefoot, CTC, Marvell e outros fabricantes de chips ASIC.

Recurso 3: O mecanismo convencional de controle de fluxo PFC ponta a ponta não é aplicável aos serviços NPB. O núcleo do mecanismo de controle de fluxo PFC é obter feedback de supressão de tráfego ponta a ponta e, em última análise, reduzir o envio de pacotes para a pilha de protocolos do terminal de comunicação para aliviar o congestionamento. No entanto, a fonte de pacotes dos serviços NPB são pacotes espelhados, portanto a estratégia de processamento de congestionamento só pode ser descartada ou armazenada em cache.

A seguir está o aparecimento de uma micro-explosão típica na curva de fluxo:

Micro Explosão 3

Tomando como exemplo a interface 10G, no diagrama de análise de tendência de tráfego de segundo nível, a taxa de tráfego é mantida em cerca de 3 Gbps por um longo período. No gráfico de análise de tendências de micro milissegundos, o pico de tráfego (MicroBurst) excedeu em muito a taxa física da interface 10G.

Técnicas-chave para mitigar microburst de NPB

Reduza o impacto da incompatibilidade de taxa de interface física assimétrica- Ao projetar uma rede, reduza ao máximo as taxas assimétricas de interface física de entrada e saída. Um método típico é usar um link de interface de uplink de taxa mais alta e evitar taxas de interface física assimétricas (por exemplo, copiar tráfego de 1 Gbit/s e 10 Gbit/s ao mesmo tempo).

Otimize a política de gerenciamento de cache do serviço NPB- A política comum de gestão de cache aplicável ao serviço de comutação não é aplicável ao serviço de encaminhamento do serviço NPB. A política de gestão de cache de garantia estática + partilha dinâmica deverá ser implementada com base nas funcionalidades do serviço NPB. A fim de minimizar o impacto do microburst NPB sob a atual limitação do ambiente de hardware do chip.

Implementar gerenciamento de engenharia de tráfego classificado- Implementar a gestão prioritária da classificação dos serviços de engenharia de tráfego com base na classificação do tráfego. Garanta a qualidade do serviço de diferentes filas de prioridade com base nas larguras de banda das filas de categoria e garanta que os pacotes de tráfego de serviço sensíveis ao usuário possam ser encaminhados sem perda de pacotes.

Uma solução de sistema razoável aumenta a capacidade de cache de pacotes e a capacidade de modelagem de tráfego- Integra a solução através de vários meios técnicos para expandir a capacidade de cache de pacotes do chip ASIC. Ao moldar o fluxo em diferentes locais, a micro-explosão torna-se uma curva de fluxo microuniforme após a modelagem.

Solução de gerenciamento de tráfego Mylinking™ Micro Burst

Esquema 1 - Estratégia de gerenciamento de cache otimizado para rede + gerenciamento de prioridade de qualidade de serviço classificado em toda a rede

Estratégia de gerenciamento de cache otimizada para toda a rede

Com base na compreensão profunda das características do serviço NPB e dos cenários práticos de negócios de um grande número de clientes, os produtos de coleta de tráfego Mylinking™ implementam um conjunto de estratégias de gerenciamento de cache NPB de "garantia estática + compartilhamento dinâmico" para toda a rede, que tem um bom efeito no gerenciamento de cache de tráfego no caso de um grande número de interfaces assimétricas de entrada e saída. A tolerância ao microburst é alcançada ao máximo quando o cache do chip ASIC atual é corrigido.

Tecnologia de Processamento Microburst - Gestão baseada nas prioridades do negócio

Micro Explosão 4

Quando a unidade de captura de tráfego é implantada de forma independente, ela também pode ser priorizada de acordo com a importância da ferramenta de análise de back-end ou a importância dos próprios dados de serviço. Por exemplo, entre muitas ferramentas de análise, o APM/BPC tem uma prioridade mais alta do que as ferramentas de análise/monitoramento de segurança porque envolve o monitoramento e a análise de vários dados indicadores de sistemas de negócios importantes. Portanto, para este cenário, os dados exigidos pelo APM/BPC podem ser definidos como de alta prioridade, os dados exigidos pelas ferramentas de monitoramento/análise de segurança podem ser definidos como de prioridade média e os dados exigidos por outras ferramentas de análise podem ser definidos como de baixa prioridade. prioridade. Quando os pacotes de dados coletados entram na porta de entrada, as prioridades são definidas de acordo com a importância dos pacotes. Pacotes de prioridades mais altas são encaminhados preferencialmente após os pacotes de prioridades mais altas serem encaminhados, e pacotes de outras prioridades são encaminhados após os pacotes de prioridades mais altas serem encaminhados. Se pacotes de prioridades mais altas continuarem a chegar, os pacotes de prioridades mais altas serão encaminhados preferencialmente. Se os dados de entrada excederem a capacidade de encaminhamento da porta de saída por um longo período de tempo, os dados excedentes serão armazenados no cache do dispositivo. Se o cache estiver cheio, o dispositivo descarta preferencialmente os pacotes de ordem inferior. Este mecanismo de gerenciamento priorizado garante que as principais ferramentas de análise possam obter com eficiência os dados de tráfego originais necessários para análise em tempo real.

Tecnologia de Processamento Microburst - mecanismo de garantia de classificação da qualidade do serviço de toda a rede

Micro Explosão 5

Conforme mostrado na figura acima, a tecnologia de classificação de tráfego é usada para distinguir diferentes serviços em todos os dispositivos na camada de acesso, camada de agregação/núcleo e camada de saída, e as prioridades dos pacotes capturados são remarcadas. O controlador SDN entrega a política de prioridade de tráfego de maneira centralizada e aplica-a aos dispositivos de encaminhamento. Todos os dispositivos participantes da rede são mapeados para diferentes filas de prioridade de acordo com as prioridades transportadas pelos pacotes. Desta forma, os pacotes de prioridade avançada de pequeno tráfego podem atingir perda zero de pacotes. Resolva efetivamente o problema de perda de pacotes de monitoramento APM e serviços especiais de auditoria de desvio de tráfego.

Solução 2 - Cache do sistema de expansão em nível de GB + esquema de modelagem de tráfego
Cache estendido do sistema de nível GB
Quando o dispositivo da nossa unidade de aquisição de tráfego possui recursos avançados de processamento funcional, ele pode abrir uma certa quantidade de espaço na memória (RAM) do dispositivo como o buffer global do dispositivo, o que melhora muito a capacidade do buffer do dispositivo. Para um único dispositivo de aquisição, pelo menos GB de capacidade pode ser fornecida como espaço de cache do dispositivo de aquisição. Esta tecnologia torna a capacidade de buffer do nosso dispositivo de aquisição de tráfego centenas de vezes maior do que a do dispositivo de aquisição tradicional. Sob a mesma taxa de encaminhamento, a duração máxima do micro burst do nosso dispositivo de unidade de aquisição de tráfego torna-se mais longa. O nível de milissegundos suportado pelo equipamento de aquisição tradicional foi atualizado para o segundo nível, e o tempo de micro-explosão que pode suportar foi aumentado milhares de vezes.

Capacidade de modelagem de tráfego multifilas

Tecnologia de processamento Microburst - uma solução baseada em grande cache de buffer + modelagem de tráfego

Micro Explosão 6

Com uma capacidade de buffer supergrande, os dados de tráfego gerados pelo micro-burst são armazenados em cache e a tecnologia de modelagem de tráfego é usada na interface de saída para obter uma saída suave de pacotes para a ferramenta de análise. Através da aplicação desta tecnologia, o fenômeno de perda de pacotes causado por micro-burst é fundamentalmente resolvido.


Horário da postagem: 27 de fevereiro de 2024