
Resfriamento líquido: o novo padrão para a infraestrutura crítica que suporta IA e Computação de Alto Desempenho
Robson Pacheco*

Os avanços em computação de alto desempenho (HPC), streaming, aprendizado de máquina (ML) e IA estão promovendo um momento de convergência tecnológica. Há uma década, os racks de TI consumiam entre 5 e 10 kW; alguns consumiam apenas 1 kW. Esta faixa permaneceu inalterada por muito tempo. O desenvolvimento de chips de alto desempenho e arquiteturas específicas para IA, porém, levou a sistemas mais potentes e densos, fazendo com que os racks possam agora facilmente exceder 100 kW com um consumo de energia entre 400 e 600 watts. Esta realidade traz consigo um desafio fundamental: dissipar o calor gerado por estes sistemas.
Estes novos chips modernos, incluindo os aceleradores de IA como GPUs e TPUs, não podem transferir seu calor de maneira efetiva. Isso acontece porque geram densidades térmicas extremamente altas e operam a temperaturas que superam as capacidades dos métodos convencionais de resfriamento por ar.
A saída de calor pode alcançar várias centenas de watts por centímetro quadrado, o que faz com que os dissipadores de calor e ventiladores tradicionais sejam inadequados para manter temperaturas operativas seguras. Isto tem aumentado a importância e a adoção de novas opções de resfriamento líquido, tecnologias que inerentemente dissipam o calor de maneira mais eficiente que os sistemas tradicionais de resfriamento por ar.
O resfriamento líquido reduz o consumo de energia e melhora a disponibilidade de capacidade nos sistemas elétricos ao diminuir o uso de energia da infraestrutura de resfriamento em até 30%. Esse modelo minimiza o estrangulamento térmico (um mecanismo que reduz o rendimento de um processador para prevenir o superaquecimento), um problema que afeta o desempenho. Isso permite implementações de maior densidade em centros de dados enquanto se mantêm condições operativas ótimas para os componentes de hardware.
Por que usar resfriamento líquido?
O resfriamento por ar foi suficiente durante muito tempo. No entanto, nesta nova era, o resfriamento líquido surgiu como uma solução necessária, com a água posicionada como a nova protagonista no resfriamento de centros de dados. No podcast de vídeo “What is next?”, Diego Corceiro, gerente de engenharia mecânica na LZA, explicou que a água tem uma condutividade térmica significativamente maior que o ar, o que a faz um meio mais eficiente para dissipar o calor. À medida que as CPUs e GPUs se tornam mais densas e agregam mais potência de computação por rack, o espaço disponível para a entrada de ar se reduz e a circulação de ar por si só é insuficiente. Neste contexto, o resfriamento líquido, particularmente o sistema direto ao chip, no qual o fluido circula através de placas frias que distribuem o resfriamento através do chip, é uma solução efetiva para gerenciar estes novos componentes de alta carga térmica.
O resfriamento líquido oferece diversos benefícios, incluindo maior eficiência térmica através das capacidades superiores de transferência de calor da água, consumo reduzido de energia (menos ventiladores são necessários, então menos energia é usada para movimento do ar), alta escalabilidade modular (ideal para projetos que crescem em fases), menor footprint físico e melhor controle ambiental (sistemas mais silenciosos e energeticamente eficientes).
Embora a tecnologia de resfriamento líquido esteja avançando rapidamente, uma abordagem híbrida de resfriamento líquido e ar para o data center é atualmente a opção mais realista. Por enquanto, não é viável resfriar 100% de um data center com água na maioria dos casos. Tenho visto uma combinação de algumas fileiras com racks de resfriamento líquido e outras com soluções tradicionais de ar, como Computer Room Air Conditioners (CRACs) ou Air Handling Units (AHUs), que são sistemas especializados para controle de temperatura e umidade em data centers.
Considerações para a estratégia de resfriamento líquido
Quem está interessado em construir um data center robusto, sofisticado e seguro na região, pode seguir passos concretos para isso:
- Estudar o mercado. Quem serão os clientes? Quais cargas eles manipularão? Sem essa clareza, a nova infraestrutura pode se tornar obsoleta em apenas dois anos.
- Projetar de forma inteligente. Com resfriamento líquido, é possível reduzir o número de racks necessários e concentrar a carga em um espaço menor. Isso dá flexibilidade para começar pequeno e crescer ao longo do tempo. É recomendável aconsiderar a infraestrutura mecânica, elétrica e civil desde o início.
- Preparar-se para o futuro. Se o objetivo é construir um site moderno, é importante integrar o resfriamento líquido desde o início. Isso inclui entender requisitos térmicos, condições do edifício, pontos de acesso, eficiência energética e mais.
- Entender o cliente: Alguns só precisarão de resfriamento líquido em áreas específicas, enquanto o resto continuará operando com resfriamento a ar. A chave é calcular um período de retorno bem planejado para permitir um bom retorno sobre o investimento.
Um data center que já existe pode ser adaptado para computação de alta densidade. Não é apenas uma questão de instalar um tubo de água fria. É estratégico avaliar o sistema de automação, infraestrutura elétrica, arquitetura civil, pontos de drenagem e carga estrutural no piso, entre outras questões. Não é um processo simples ou rápido, mas é viável, como mostra este guia.
Devido à explosão da IA, HPC, streaming e outros serviços, a demanda continuará aumentando: O resfriamento líquido veio para ficar. Nessa jornada, pode ser recomendável contar com equipes de produtos e serviços que oferecem a expertise técnica para suportar toda a cadeia de gerenciamento térmico (resfriamento a ar, resfriamento líquido e rejeição de calor externa) e trem de força end-to-end. Trata-se de uma abordagem consultiva que ajuda o gestor do data center a escolher os sistemas e componentes certos para suas necessidades. Essa oferta inclui monitoramento remoto, manutenção preventiva e serviços de solução de problemas para manter as soluções de resfriamento líquido e energia funcionando com desempenho máximo.
*Robson Pacheco é Diretor de Vendas de Contas Estratégicas da Vertiv Latam.
