Microsoft anuncia o Maia 200: chip de aceleração de IA

Novo acelerador da Microsoft supera rivais com arquitetura de 3nm e foco total em eficiência para modelos avançados como o GPT-5.2.

Publicado: 29/01/2026
Alterado: 26/01/2026
Autor: Redação
Fonte: Secult PMSCS

Crédito: Divulgação/Microsoft

A Microsoft redefine o padrão de processamento de inteligência artificial com o lançamento do Maia 200, um acelerador projetado especificamente para otimizar a inferência. Fabricado no processo de 3nm da TSMC, este componente promete transformar drasticamente a economia da geração de tokens, oferecendo uma solução robusta para os desafios atuais de infraestrutura.

O equipamento se destaca não apenas pela potência, mas pela engenharia focada em eficiência. O Maia 200 integra núcleos tensores nativos FP8 e FP4, estabelecendo-se como o silício proprietário de maior performance entre os hiperescaladores atuais.

Potência bruta e eficiência do Maia 200

A arquitetura do novo chip entrega resultados expressivos em comparação com as soluções de mercado. Ele oferece três vezes mais desempenho em FP4 do que a terceira geração do Amazon Trainium e supera a sétima geração do TPU do Google em operações FP8.

Para os gestores de tecnologia, o dado mais relevante é o custo-benefício. O novo hardware proporciona 30% mais desempenho por dólar em relação à linha atual da empresa.

As especificações técnicas impressionam pela densidade e capacidade:

Processamento: Mais de 100 bilhões de transistores por chip.
Performance: Entrega superior a 10 petaFLOPS em precisão de 4 bits (FP4) e cerca de 5 petaFLOPS em 8 bits (FP8).
Memória: Sistema redesenhado com 216 GB de HBM3e rodando a 7 TB/s.
SRAM Integrada: 272 MB para manter a alimentação de dados constante.

Arquitetura de memória e rede escalável

O poder de processamento (FLOPS) é inútil sem uma alimentação de dados adequada. Para resolver esse gargalo, o Maia 200 utiliza um subsistema de memória focado em alta largura de banda e um motor DMA especializado. Isso garante que modelos massivos operem com alta taxa de transferência de tokens.

Em termos de conectividade, a Microsoft implementou um design de rede em duas camadas baseado em Ethernet padrão. Essa escolha elimina a dependência de estruturas proprietárias e reduz custos.

Cada acelerador oferece 2,8 TB/s de largura de banda bidirecional dedicada. A arquitetura permite clusters densos de até 6.144 aceleradores, mantendo operações previsíveis e estáveis. Dentro de cada rack, quatro unidades se conectam por links diretos, dispensando comutadores complexos e reduzindo a latência.

Impacto no GPT-5.2 e ecossistema Azure

A aplicação prática dessa tecnologia já está definida. A infraestrutura heterogênea da Microsoft utilizará o Maia 200 para rodar os modelos mais recentes, incluindo o GPT-5.2 da OpenAI.

O chip também será fundamental para:

Microsoft Foundry e Copilot: Vantagem competitiva em custo e velocidade.
Dados Sintéticos: Aceleração na geração e filtragem de dados de alta qualidade.
Superinteligência: Apoio em aprendizado por reforço para aprimorar modelos internos.

Para os desenvolvedores, a integração é fluida. O SDK do Maia 200 inclui suporte nativo ao PyTorch e um compilador Triton. Isso oferece controle preciso (acesso a linguagem de baixo nível) e portabilidade facilitada entre diferentes hardwares.

Disponibilidade e infraestrutura

A implantação do hardware segue um cronograma agressivo. As unidades já operam na região de datacenters “US Central”. A expansão para “US West 3”, próxima a Phoenix (Arizona), será a próxima etapa, com outras regiões globais no planejamento.

A velocidade dessa entrega deve-se à validação pré-silício. A Microsoft modelou padrões de computação de LLMs antes mesmo da fabricação física. O sistema de refrigeração líquida de segunda geração e a integração nativa com o plano de controle do Azure garantem confiabilidade desde o primeiro dia.

Essa abordagem de ponta a ponta — do design do chip ao software de gerenciamento — permitiu que modelos rodassem no silício poucos dias após a chegada da primeira peça. Com essa estratégia, o Maia 200 consolida a liderança da Microsoft na nuvem, oferecendo melhorias sustentadas em desempenho por watt.