A inteligência artificial (IA) está, sem dúvida, remodelando o mundo, influenciando áreas como educação, saúde, finanças e política externa. À medida que empresas e fornecedores de data centers continuam a adotar plataformas de infraestrutura específicas, como o NVIDIA DGX SuperPOD, para utilizar IA em larga escala, as pressões sobre os engenheiros de redes ópticas de centros de dados aumentam. Como resultado, a tecnologia de transceptores ópticos ganha uma importância renovada.
O dilúvio de dados de IA cria desafios para arquiteturas DCI e intra-data centers
Em diversos setores, as empresas estão cada vez mais adotando cargas de trabalho de IA intensivas em dados, com algumas das maiores aplicações generativas de IA contando com trilhões de parâmetros. Desde a modelagem de grandes linguagens e treinamento de IA até simulações de computação de alto desempenho (HPC), essas cargas de trabalho geram grandes volumes de dados que precisam ser processados, analisados e roteados dentro e entre os data centers. Com isso, os engenheiros de redes de data centers enfrentam imensa pressão para otimizar suas arquiteturas de interconexão de data centers (DCI) e redes intra-data centers, a fim de acomodar as crescentes demandas dos aplicativos orientados por IA, enquanto planejam para o futuro.
Em um artigo recente da Data Center Frontier, Sameh Boujelbene, vice-presidente do Grupo Dell’Oro, afirmou que o número de parâmetros tratados por aplicações generativas de IA está crescendo dez vezes a cada ano. À medida que os data centers empresariais, de hiperescala e provedores de colocation começam a implantar milhares ou mesmo “centenas de milhares de nós acelerados”, as redes de data centers terão dificuldades para acompanhar esse fluxo contínuo de dados. Peter Jones, presidente da Ethernet Alliance, observa que os limites da rede de data centers em hiperescala estão “ultrapassando o limite de Terabits por segundo”. Uma pesquisa recente da Omdia revela que o uso de IA aumentará significativamente a adoção de tecnologias ópticas em data centers de todos os tamanhos, com taxas de dados mais baixas, como 100G e 200G, sendo substituídas por taxas mais altas, como 400G, 800G e 1,6T.
O que isso significa para o DCI e as estruturas de rede nos data centers atuais? A resposta está na adoção de taxas de dados mais altas, como 800G e até 1,2T e 1,6T. Do ponto de vista da conectividade intra-data center, isso também implica maior foco no design de transceptores para melhorar a escalabilidade, reduzir a latência e aumentar a eficiência energética, atendendo assim às demandas de alta velocidade, baixa latência e uso intensivo de dados das aplicações de IA. A óptica plugável linear (LPO) e a óptica co-embalada (CPO) emergem como fortes concorrentes na transformação da equação tradicional de potência e latência nos data centers.
A tecnologia de acionamento linear, aproveitada pelos links LPO, elimina a necessidade de processamento complexo de sinais digitais (DSP) na óptica, contando com o DSP SERDES no chip do switch para formatação digital. O DSP no switch ASIC aciona um mecanismo óptico que inclui apenas amplificadores lineares. Como resultado, o consumo de energia do LPO é muito menor do que o das variantes conectáveis convencionais, tornando-o uma escolha atraente, já que as operadoras de data centers utilizam mais transceptores em suas redes em resposta às demandas da IA.
A face moderna da DCI e da conectividade intra-data center: 800G e novas interfaces com eficiência energética
Com transceptores 400G já bem estabelecidos no mercado, as operadoras de data centers estão começando a considerar a implantação de tecnologias 800G para lidar com os vastos volumes de dados gerados pela IA e outras aplicações de HPC. No Relatório Pós-Show de 2024 do OFC, destaca-se que as instalações da variante 800G acelerarão em 2024 e além para oferecer suporte às redes backend de IA, bem como à rede Ethernet geral que suporta todas as cargas de trabalho dos data centers.
Quando se trata de padrões 800G interoperáveis e coerentes, o trabalho da OIF em 800ZR e 800LR é notável. O padrão OIF 800ZR é uma especificação para Ethernet 800G em um único comprimento de onda usando óptica coerente, destinada a aplicações DCI, permitindo a conexão entre data centers em distâncias de até 80 km. Já o padrão 800LR concentra-se na transmissão Ethernet 800G em um único comprimento de onda para distâncias de até 10 km, tornando-o adequado para aplicações em campus ou intra-DC, que, conforme observado pela Dell’Oro, será uma fronteira importante na evolução da rede de data centers, impulsionada pelos crescentes requisitos de largura de banda da IA.
No contexto intra-data center, tanto a óptica plugável linear (LPO) quanto a óptica co-embalada (CPO) são concorrentes sérios na transformação da equação tradicional de potência e latência dos data centers. Enquanto a tecnologia LPO elimina a necessidade de processamento complexo de sinais digitais (DSP), reduzindo o consumo de energia, a tecnologia CPO oferece benefícios significativos em termos de consumo de energia e latência, integrando mecanismos ópticos diretamente com ASICs de switch no mesmo pacote. Essa integração permite uma comunicação mais eficiente e de baixa latência entre o chip e o motor óptico, além de reduzir a necessidade de DSPs, que podem aumentar o consumo de energia do sistema em até 25-30%.
Dito isso, tanto os LPOs quanto os CPOs ainda estão nos estágios iniciais de desenvolvimento e demonstração. Ainda existem desafios, como o suporte a chips de switch, design de sistemas e interoperabilidade para os LPOs. No entanto, a criação de uma LPO MSA (Multi-Source Agreement) traz confiança de que tais questões serão resolvidas em um futuro próximo. Em ambos os casos, o objetivo é encontrar soluções que tornem a óptica mais eficiente, reduzindo o consumo de energia, a latência e o custo.
À medida que as aplicações de IA geram fluxos de dados cada vez mais diversos e complexos, os operadores de data centers precisam de soluções ópticas que possam acomodar e transportar com eficiência essas cargas em suas redes. As inovações em cada tecnologia acrescentam considerações de integração de sistemas às já complexas demandas de adaptação de um data center para aproveitar a infraestrutura computacional de IA. Diante disso, torna-se necessário que os engenheiros de redes de data centers adotem transceptores 800G para preparar sua infraestrutura para o futuro e garantir escalabilidade diante da crescente demanda por dados.
Adaptação à IA no data center requer parcerias e conhecimento especializado
Seja enfrentando desafios com a adoção de 400G ou planejando a implantação de óptica de 800G, há muito a considerar. Os requisitos de energia dos transceptores, a popularidade dos formatos, a interoperabilidade entre diferentes fornecedores e a orquestração de rede são apenas alguns dos problemas que os operadores de data centers com visão de futuro enfrentam ao tentar adaptar suas redes às demandas das cargas de trabalho de IA. É aí que podemos ajudar. Nossa equipe de engenheiros especializados possui profundo conhecimento em todos os aspectos de integração de sistemas, arquiteturas de rede e transceptores ópticos. Com testes robustos e uma abordagem consultiva, temos um histórico comprovado de transformar as visões de nossos clientes em realidade. Entre em contato conosco hoje mesmo com suas dúvidas!