A solução de “Micro Burst” no cenário de aplicação de captura de tráfego de rede de bypass

No cenário típico de aplicação NPB, o problema mais preocupante para os administradores é a perda de pacotes causada pelo congestionamento de pacotes espelhados e redes NPB. A perda de pacotes em NPB pode causar os seguintes sintomas típicos em ferramentas de análise de back-end:

- Um alarme é gerado quando o indicador de monitoramento de desempenho do serviço APM diminui e a taxa de sucesso da transação diminui

- O alarme de exceção do indicador de monitoramento de desempenho da rede NPM é gerado

- O sistema de monitoramento de segurança não consegue detectar ataques de rede devido à omissão de eventos

- Eventos de auditoria de comportamento de perda de serviço gerados pelo sistema de auditoria de serviço

... ...

Como um sistema centralizado de captura e distribuição para monitoramento de Bypass, a importância do NPB é evidente. Ao mesmo tempo, a forma como ele processa o tráfego de pacotes de dados é bastante diferente da de um switch de rede tradicional, e a tecnologia de controle de congestionamento de tráfego de muitas redes de serviço não é aplicável ao NPB. Como resolver a perda de pacotes do NPB? Vamos começar pela análise da causa raiz da perda de pacotes para entender!

Análise da causa raiz do congestionamento de perda de pacotes NPB/TAP

Primeiramente, analisamos o caminho real do tráfego e a relação de mapeamento entre o sistema e as entradas e saídas da rede de nível 1 ou NPB. Independentemente do tipo de topologia de rede que a NPB forma, como um sistema de coleta, existe uma relação de entrada e saída de tráfego de muitos para muitos entre "acesso" e "saída" de todo o sistema.

Micro Burst 1

Em seguida, analisamos o modelo de negócios do NPB da perspectiva de chips ASIC em um único dispositivo:

Micro Burst 2

Matéria 1: O "tráfego" e a "taxa de interface física" das interfaces de entrada e saída são assimétricos, resultando em um grande número de micro-bursts, o que é inevitável. Em cenários típicos de agregação de tráfego muitos-para-um ou muitos-para-muitos, a taxa física da interface de saída é geralmente menor do que a taxa física total da interface de entrada. Por exemplo, 10 canais de coleta de 10G e 1 canal de saída de 10G; em um cenário de implantação multinível, todos os NPBBS podem ser visualizados como um todo.

Matéria 2: Os recursos de cache do chip ASIC são muito limitados. Em termos do chip ASIC comumente usado atualmente, o chip com capacidade de troca de 640 Gbps tem um cache de 3 a 10 Mbytes; um chip com capacidade de 3,2 Tbps tem um cache de 20 a 50 Mbytes. Incluindo BroadCom, Barefoot, CTC, Marvell e outros fabricantes de chips ASIC.

Matéria 3: O mecanismo convencional de controle de fluxo PFC ponta a ponta não se aplica aos serviços NPB. O núcleo do mecanismo de controle de fluxo PFC é obter feedback de supressão de tráfego ponta a ponta e, em última análise, reduzir o envio de pacotes para a pilha de protocolos do ponto final de comunicação para aliviar o congestionamento. No entanto, a origem dos pacotes dos serviços NPB são pacotes espelhados, portanto, a estratégia de processamento de congestionamento só pode ser descartada ou armazenada em cache.

A seguir está a aparência de uma micro-explosão típica na curva de fluxo:

Micro Burst 3

Tomando a interface 10G como exemplo, no diagrama de análise de tendência de tráfego de segundo nível, a taxa de tráfego se manteve em cerca de 3 Gbps por um longo período. No gráfico de análise de tendência de micromilissegundos, o pico de tráfego (MicroBurst) excedeu em muito a taxa física da interface 10G.

Técnicas-chave para mitigar microexplosões de NPB

Reduza o impacto da incompatibilidade de taxas de interface física assimétricaAo projetar uma rede, reduza ao máximo as taxas assimétricas de entrada e saída da interface física. Um método típico é usar um link de interface de uplink com taxa mais alta e evitar taxas assimétricas de interface física (por exemplo, copiar tráfego de 1 Gbit/s e 10 Gbit/s simultaneamente).

Otimizar a política de gerenciamento de cache do serviço NPB- A política comum de gerenciamento de cache aplicável ao serviço de comutação não se aplica ao serviço de encaminhamento do serviço NPB. A política de gerenciamento de cache de garantia estática + compartilhamento dinâmico deve ser implementada com base nas características do serviço NPB. A fim de minimizar o impacto do microburst NPB sob as limitações atuais do ambiente de hardware do chip.

Implementar gestão de engenharia de tráfego classificada- Implementar a gestão da classificação de serviços de engenharia de tráfego prioritários com base na classificação de tráfego. Garantir a qualidade do serviço de diferentes filas prioritárias com base nas larguras de banda das filas por categoria e garantir que os pacotes de tráfego de serviço sensíveis ao usuário possam ser encaminhados sem perda de pacotes.

Uma solução de sistema razoável melhora a capacidade de armazenamento em cache de pacotes e a capacidade de modelagem de tráfego- Integra a solução por meio de vários meios técnicos para expandir a capacidade de cache de pacotes do chip ASIC. Ao moldar o fluxo em diferentes locais, a microexplosão se transforma em uma curva de fluxo microuniforme após a moldagem.

Solução de gerenciamento de tráfego Micro Burst Mylinking™

Esquema 1 - Estratégia de gerenciamento de cache otimizada para rede + gerenciamento de prioridade de qualidade de serviço classificado em toda a rede

Estratégia de gerenciamento de cache otimizada para toda a rede

Com base no profundo conhecimento das características dos serviços NPB e dos cenários práticos de negócios de um grande número de clientes, os produtos de coleta de tráfego Mylinking™ implementam um conjunto de estratégias de gerenciamento de cache NPB de "garantia estática + compartilhamento dinâmico" para toda a rede, o que tem um bom efeito no gerenciamento de cache de tráfego no caso de um grande número de interfaces de entrada e saída assimétricas. A tolerância a microbursts é alcançada ao máximo quando o cache do chip ASIC atual é fixo.

Tecnologia de Processamento de Microburst - Gestão baseada em prioridades de negócios

Micro Burst 4

Quando a unidade de captura de tráfego é implantada de forma independente, ela também pode ser priorizada de acordo com a importância da ferramenta de análise de back-end ou a importância dos próprios dados de serviço. Por exemplo, entre muitas ferramentas de análise, o APM/BPC tem prioridade maior do que as ferramentas de análise/monitoramento de segurança, pois envolve o monitoramento e a análise de diversos dados indicadores de sistemas de negócios importantes. Portanto, para este cenário, os dados exigidos pelo APM/BPC podem ser definidos como de alta prioridade, os dados exigidos pelas ferramentas de monitoramento/análise de segurança podem ser definidos como de média prioridade e os dados exigidos por outras ferramentas de análise podem ser definidos como de baixa prioridade. Quando os pacotes de dados coletados entram na porta de entrada, as prioridades são definidas de acordo com a importância dos pacotes. Pacotes de prioridades mais altas são encaminhados preferencialmente após o encaminhamento dos pacotes de prioridades mais altas, e pacotes de outras prioridades são encaminhados após o encaminhamento dos pacotes de prioridades mais altas. Se pacotes de prioridades mais altas continuarem a chegar, os pacotes de prioridades mais altas são encaminhados preferencialmente. Se os dados de entrada excederem a capacidade de encaminhamento da porta de saída por um longo período, os dados excedentes serão armazenados no cache do dispositivo. Se o cache estiver cheio, o dispositivo descarta preferencialmente os pacotes de ordem inferior. Esse mecanismo de gerenciamento priorizado garante que as principais ferramentas de análise possam obter com eficiência os dados de tráfego originais necessários para análise em tempo real.

Tecnologia de Processamento de Microburst - mecanismo de garantia de classificação de toda a qualidade do serviço de rede

Micro Burst 5

Conforme mostrado na figura acima, a tecnologia de classificação de tráfego é utilizada para distinguir diferentes serviços em todos os dispositivos na camada de acesso, camada de agregação/núcleo e camada de saída, e as prioridades dos pacotes capturados são remarcadas. O controlador SDN entrega a política de prioridade de tráfego de forma centralizada e a aplica aos dispositivos de encaminhamento. Todos os dispositivos participantes da rede são mapeados para diferentes filas de prioridade, de acordo com as prioridades transportadas pelos pacotes. Dessa forma, os pacotes de prioridade avançada de pequeno tráfego podem atingir perda zero de pacotes. Resolve efetivamente o problema de perda de pacotes do monitoramento de APM e dos serviços de tráfego de auditoria de serviços especiais.

Solução 2 - Cache do Sistema de Expansão em Nível de GB + Esquema de Modelagem de Tráfego
Cache estendido do sistema de nível GB
Quando o dispositivo da nossa unidade de aquisição de tráfego possui recursos avançados de processamento funcional, ele pode liberar uma certa quantidade de espaço na memória RAM do dispositivo como o Buffer global do dispositivo, o que melhora significativamente a capacidade do Buffer do dispositivo. Para um único dispositivo de aquisição, pelo menos GB de capacidade podem ser fornecidos como espaço de cache do dispositivo de aquisição. Essa tecnologia torna a capacidade do Buffer do nosso dispositivo de unidade de aquisição de tráfego centenas de vezes maior do que a dos dispositivos de aquisição tradicionais. Sob a mesma taxa de encaminhamento, a duração máxima do microburst do nosso dispositivo de unidade de aquisição de tráfego se torna mais longa. O nível de milissegundos suportado pelos equipamentos de aquisição tradicionais foi atualizado para o segundo nível, e o tempo de microburst que pode ser suportado foi aumentado em milhares de vezes.

Capacidade de modelagem de tráfego multifila

Tecnologia de processamento de microburst - uma solução baseada em grande cache de buffer + modelagem de tráfego

Micro Burst 6

Com uma capacidade de buffer supergrande, os dados de tráfego gerados por microburst são armazenados em cache, e a tecnologia de modelagem de tráfego é utilizada na interface de saída para garantir uma saída uniforme dos pacotes para a ferramenta de análise. Com a aplicação dessa tecnologia, o fenômeno de perda de pacotes causado por microburst é fundamentalmente resolvido.


Horário da publicação: 27 de fevereiro de 2024