A solução para o problema de "microburst" em cenários de aplicação de captura de tráfego de rede com bypass.

Em um cenário típico de aplicação NPB, o problema mais crítico para os administradores é a perda de pacotes causada pelo congestionamento de pacotes espelhados e das redes NPB. A perda de pacotes em NPB pode causar os seguintes sintomas típicos em ferramentas de análise de back-end:

Um alarme é gerado quando o indicador de monitoramento de desempenho do serviço APM diminui e a taxa de sucesso das transações também diminui.

- Foi gerado um alarme de exceção para o indicador de monitoramento de desempenho da rede NPM.

O sistema de monitoramento de segurança não detecta ataques de rede devido à omissão de eventos.

- Perda de eventos de auditoria de comportamento de serviço gerados pelo sistema de auditoria de serviço

... ...

Como um sistema centralizado de captura e distribuição para monitoramento de bypass, a importância do NPB é evidente. Ao mesmo tempo, a forma como ele processa o tráfego de pacotes de dados é bastante diferente da de um switch de rede tradicional, e a tecnologia de controle de congestionamento de tráfego de muitas redes de serviços não se aplica ao NPB. Como resolver a perda de pacotes no NPB? Vamos começar pela análise da causa raiz da perda de pacotes!

Análise da causa raiz da congestão e perda de pacotes NPB/TAP

Primeiramente, analisamos o caminho real do tráfego e a relação de mapeamento entre o sistema e as entradas e saídas da rede NPB de nível 1 ou de nível 2. Independentemente da topologia de rede que o NPB forma, como um sistema de coleta, existe uma relação de entrada e saída de tráfego de muitos para muitos entre o "acesso" e a "saída" de todo o sistema.

Micro Burst 1

Em seguida, analisamos o modelo de negócios da NPB sob a perspectiva de chips ASIC em um único dispositivo:

Micro Burst 2

Recurso 1A assimetria entre o "tráfego" e a "taxa de interface física" das interfaces de entrada e saída resulta inevitavelmente em um grande número de micro-bursts. Em cenários típicos de agregação de tráfego muitos-para-um ou muitos-para-muitos, a taxa física da interface de saída geralmente é menor que a taxa física total da interface de entrada. Por exemplo, 10 canais de coleta de 10G e 1 canal de saída de 10G; em um cenário de implantação multinível, todos os NPBBS podem ser vistos como um todo.

Recurso 2Os recursos de cache dos chips ASIC são muito limitados. Em termos dos chips ASIC atualmente mais utilizados, um chip com capacidade de troca de dados de 640 Gbps possui um cache de 3 a 10 MB; um chip com capacidade de 3,2 Tbps possui um cache de 20 a 50 MB. Isso inclui chips ASIC de fabricantes como Broadcom, Barefoot, CTC, Marvell e outros.

Recurso 3O mecanismo convencional de controle de fluxo PFC de ponta a ponta não é aplicável a serviços NPB. O princípio fundamental do mecanismo de controle de fluxo PFC é realizar o feedback de supressão de tráfego de ponta a ponta e, em última instância, reduzir o envio de pacotes para a pilha de protocolos do ponto de extremidade da comunicação para aliviar o congestionamento. No entanto, a origem dos pacotes dos serviços NPB são pacotes espelhados, portanto, a estratégia de processamento de congestionamento só pode ser descartada ou armazenada em cache.

A seguir, apresenta-se a aparência de uma micro-ruptura típica na curva de fluxo:

Micro Burst 3

Tomando como exemplo a interface 10G, no diagrama de análise de tendência de tráfego de segundo nível, a taxa de tráfego se mantém em torno de 3 Gbps por um longo período. No gráfico de análise de tendência em microssegundos, o pico de tráfego (MicroBurst) ultrapassou em muito a taxa física da interface 10G.

Técnicas-chave para mitigar microexplosões de NPB

Reduzir o impacto da incompatibilidade assimétrica da taxa de transferência na interface física.Ao projetar uma rede, reduza ao máximo a assimetria nas taxas de interface física de entrada e saída. Um método típico é usar um link de uplink com taxa mais alta e evitar taxas de interface física assimétricas (por exemplo, copiar tráfego de 1 Gbit/s e 10 Gbit/s simultaneamente).

Otimize a política de gerenciamento de cache do serviço NPB.A política de gerenciamento de cache comum aplicável ao serviço de comutação não se aplica ao serviço de encaminhamento do serviço NPB. A política de gerenciamento de cache com garantia estática + compartilhamento dinâmico deve ser implementada com base nas características do serviço NPB, a fim de minimizar o impacto de microbursts do NPB sob as limitações do ambiente de hardware do chip atual.

Implementar gerenciamento de engenharia de tráfego classificadoImplementar a gestão da classificação de serviços de engenharia de tráfego prioritário com base na classificação de tráfego. Garantir a qualidade do serviço em diferentes filas de prioridade com base na largura de banda das filas por categoria e assegurar que os pacotes de tráfego de serviços sensíveis ao usuário possam ser encaminhados sem perda de pacotes.

Uma solução de sistema adequada aprimora a capacidade de armazenamento em cache de pacotes e a capacidade de modelagem de tráfego.- Integra a solução por meio de diversos recursos técnicos para expandir a capacidade de cache de pacotes do chip ASIC. Ao moldar o fluxo em diferentes locais, o micro-burst se transforma em uma curva de fluxo microuniforme após a modelagem.

Solução de gerenciamento de tráfego de microburst Mylinking™

Esquema 1 - Estratégia de gerenciamento de cache otimizada para a rede + gerenciamento de prioridades de qualidade de serviço classificado em toda a rede

Estratégia de gerenciamento de cache otimizada para toda a rede.

Com base no profundo conhecimento das características do serviço NPB e nos cenários de negócios práticos de um grande número de clientes, os produtos de coleta de tráfego Mylinking™ implementam uma estratégia de gerenciamento de cache NPB do tipo "garantia estática + compartilhamento dinâmico" para toda a rede. Essa estratégia apresenta um bom desempenho no gerenciamento de cache de tráfego em casos com um grande número de interfaces de entrada e saída assimétricas. A tolerância a microbursts é maximizada quando o cache do chip ASIC atual é fixo.

Tecnologia de Processamento Microburst - Gestão baseada em prioridades de negócios

Micro Burst 4

Quando a unidade de captura de tráfego é implantada de forma independente, ela também pode ser priorizada de acordo com a importância da ferramenta de análise de back-end ou a importância dos próprios dados do serviço. Por exemplo, entre várias ferramentas de análise, o APM/BPC tem prioridade maior do que as ferramentas de análise/monitoramento de segurança, pois envolve o monitoramento e a análise de diversos dados indicadores de sistemas de negócios importantes. Portanto, nesse cenário, os dados exigidos pelo APM/BPC podem ser definidos como de alta prioridade, os dados exigidos pelas ferramentas de monitoramento/análise de segurança podem ser definidos como de média prioridade e os dados exigidos por outras ferramentas de análise podem ser definidos como de baixa prioridade. Quando os pacotes de dados coletados entram na porta de entrada, as prioridades são definidas de acordo com a importância dos pacotes. Pacotes de prioridades mais altas são encaminhados preferencialmente após os pacotes de prioridades mais altas, e pacotes de outras prioridades são encaminhados após os pacotes de prioridades mais altas. Se pacotes de prioridades mais altas continuarem a chegar, eles serão encaminhados preferencialmente. Se os dados de entrada excederem a capacidade de encaminhamento da porta de saída por um longo período, o excesso de dados é armazenado no cache do dispositivo. Se o cache estiver cheio, o dispositivo descarta preferencialmente os pacotes de menor prioridade. Esse mecanismo de gerenciamento prioritário garante que as principais ferramentas de análise possam obter, de forma eficiente e em tempo real, os dados de tráfego originais necessários para a análise.

Tecnologia de Processamento de Microburst - mecanismo de classificação e garantia da qualidade de serviço de toda a rede.

Micro Burst 5

Conforme ilustrado na figura acima, a tecnologia de classificação de tráfego é utilizada para distinguir diferentes serviços em todos os dispositivos nas camadas de acesso, agregação/núcleo e saída, e as prioridades dos pacotes capturados são redefinidas. O controlador SDN implementa a política de priorização de tráfego de forma centralizada e a aplica aos dispositivos de encaminhamento. Todos os dispositivos participantes da rede são mapeados para diferentes filas de prioridade, de acordo com as prioridades dos pacotes transportados. Dessa forma, pacotes com baixo volume de tráfego e alta prioridade podem atingir zero perda de pacotes. Isso resolve eficazmente o problema de perda de pacotes em serviços de monitoramento APM e de bypass de auditoria de serviços especiais.

Solução 2 - Cache de sistema de expansão em nível de GB + esquema de modelagem de tráfego
Cache estendido do sistema de nível GB
Quando o dispositivo da nossa unidade de aquisição de tráfego possui capacidades avançadas de processamento funcional, ele pode liberar uma certa quantidade de espaço na memória (RAM) do dispositivo como buffer global, o que melhora significativamente a capacidade de buffer do dispositivo. Para um único dispositivo de aquisição, pelo menos 1 GB de capacidade pode ser fornecido como espaço de cache. Essa tecnologia torna a capacidade de buffer da nossa unidade de aquisição de tráfego centenas de vezes maior do que a dos dispositivos de aquisição tradicionais. Sob a mesma taxa de encaminhamento, a duração máxima de micro-rajadas da nossa unidade de aquisição de tráfego torna-se maior. O nível de milissegundos suportado pelos equipamentos de aquisição tradicionais foi atualizado para o nível de segundos, e o tempo de micro-rajadas que pode suportar foi aumentado em milhares de vezes.

Capacidade de modelagem de tráfego em múltiplas filas

Tecnologia de Processamento Microburst - uma solução baseada em cache de buffer de grande porte + modelagem de tráfego.

Micro Burst 6

Com uma capacidade de buffer extremamente grande, os dados de tráfego gerados por micro-rajadas são armazenados em cache, e a tecnologia de modelagem de tráfego é utilizada na interface de saída para garantir uma saída suave dos pacotes para a ferramenta de análise. Através da aplicação dessa tecnologia, o fenômeno de perda de pacotes causado por micro-rajadas é resolvido de forma definitiva.


Data da publicação: 27/02/2024