Durante las últimas décadas, la aparición de servicios como la computación en la nube, las redes 5G o el big data, entre otros, ha provocado un crecimiento exponencial en el volumen de datos generados por la industria de las tecnologías de la información y las comunicaciones (TIC).
Esto ha colocado los centros de datos en el epicentro de la revolución digital, obligándolos a evolucionar rápidamente para satisfacer el constante incremento de potencia informática demandada por las nuevas aplicaciones.
Sin embargo, esta industria no está exenta de impacto ambiental: en 2022 los centros de datos consumieron 460 TWh de electricidad a nivel global, y se estima que esta cifra se triplique en 2030, pudiendo llegar a consumir en pocos años más electricidad que la India, el país más poblado del mundo. Y aproximadamente un 40% de este consumo es debido a los sistemas de refrigeración de estas infraestructuras.
Tradicionalmente, los centros de datos han utilizado sistemas de refrigeración por aire, pero recientemente se ha alcanzado un punto de inflexión, acentuado por la aparición de la inteligencia artificial (IA). El diseño y las demandas térmicas de los circuitos integrados están cambiando radicalmente.
Hasta hace poco, los servidores solían contar con una o dos CPU con una potencia de diseño térmico (TDP) de 200 W cada una. Pero los servidores actuales pueden tener una TDP de 500 W para la unidad central de procesamiento (CPU) y hasta 760 W para la unidad de procesamiento gráfico (GPU), clave para el procesamiento de la IA. Esto implica que un servidor con 4 GPU genera casi 2,5 kW de calor por servidor, llegando a los 50 kW de calor generado en cada rack. Y el TDP de las GPU no hace más que incrementar.
Esta evolución en las demandas térmicas y de rendimiento ha impulsado la adopción de tecnologías de refrigeración más eficientes, como la refrigeración líquida, que se está convirtiendo en una necesidad para manejar estas nuevas cargas de trabajo. Debido a su mayor capacidad calorífica, densidad y conductividad térmica, el agua puede transportar hasta 3.500 veces más calor por unidad de volumen que el aire para un mismo incremento de temperatura.
Así, mientras que los centros de datos refrigerados por aire pueden soportar alrededor de 30 kW de calor por rack, las últimas innovaciones en refrigeración líquida pueden llegar a enfriar más de 120 kW por rack. Esta mayor capacidad de extracción de calor permite utilizar los procesadores en todo su potencial de manera mucho más eficiente y efectiva, incrementando su rendimiento, reduciendo las ralentizaciones causadas por las altas temperaturas y contribuyendo a la vida útil general del procesador.
Pero más allá de la capacidad de enfriamiento, la refrigeración líquida ofrece importantes ventajas en términos de eficiencia energética. Al ser más eficiente la transferencia de calor, los sistemas de refrigeración líquida pueden reducir significativamente el consumo de energía en comparación con los métodos tradicionales de refrigeración por aire.
Esto no solo disminuye los costos operativos para los centros de datos, sino que también reduce su huella de carbono. En muchos casos, la implementación de refrigeración líquida puede resultar en una reducción del consumo energético de hasta un 40% en un centro de datos, lo que supone un ahorro relevante tanto en términos económicos como medioambientales.
Existen diferentes tecnologías de refrigeración líquida que en términos generales se pueden clasificar en dos categorías: refrigeración por inmersión y directa-al-chip.
Refrigeración por inmersión
Este tipo de refrigeración se basa en la inmersión directa del servidor o componentes calientes en un líquido dieléctrico no conductor. Puede presentarse como inmersión monofásica (el líquido no cambia de fase) o bifásica (con cambio de fase líquido a gas), aunque esta última aún presenta retos tecnológicos importantes que limitan su adopción a nivel comercial.
El enfriamiento por inmersión puede soportar temperaturas del procesador más altas que el aire, lo que permite aumentar la densidad de potencia de los racks y mejorar la eficiencia energética de los centros de datos.
Sin embargo, este tipo de refrigeración presenta algunos inconvenientes como importantes modificaciones en la infraestructura del centro de datos, mayor inercia térmica o el requerimiento de altos caudales de líquido y grandes bombas para hacer frente a procesadores con un alto TDP, lo que implica un mayor requerimiento energético.
Al ser el enfriamiento por inmersión un cambio radical de los sistemas de refrigeración usados tradicionalmente en los centros de datos, este requiere de costes iniciales significativos y desafíos complejos de implementación y mantenimiento.
Refrigeración directa-al-chip
La refrigeración directa-al-chip consiste en dirigir directamente el líquido refrigerante a los componentes más calientes de un servidor (CPU o GPU) a través de una placa fría colocada directamente sobre el chip. Así, el líquido absorbe el calor fluyendo dentro de la placa fría y después es bombeado fuera del servidor, donde se enfría.
Igual que los sistemas de refrigeración por inmersión, esta tecnología puede usarse con o sin cambio de fase del líquido. El primer caso tiene un diseño más simple y menor coste, mientras que los sistemas bifásicos, aunque tienen más capacidad de extracción de calor, presentan limitaciones tecnológicas y problemas de escalabilidad.
La refrigeración directa-al-chip, además de una alta eficiencia en la transferencia de calor y reducción del consumo energético, presenta una menor complejidad de implementación, ya que no requiere de modificaciones drásticas en el servidor ni el centro de datos, lo que se traduce en menores costos iniciales.
Existen diferentes configuraciones de instalación para esta tecnología, dependiendo de la ubicación de las unidades de distribución del refrigerante y extracción de calor y la solución óptima puede cambiar en función de las necesidades de cada centro de datos.
En conclusión, la refrigeración líquida se está consolidando como el estándar de las infraestructuras de IA, impulsada por las crecientes demandas térmicas de sus procesadores. La elección de la solución de refrigeración más adecuada dependerá de las necesidades específicas y las limitaciones de cada centro de datos, permitiendo incluso la combinación de diferentes tecnologías.
Actualmente, la refrigeración líquida monofásica directa-al-chip destaca en la industria debido a su rendimiento, facilidad de implementación y reducción de costes energéticos. Esta tecnología es especialmente eficaz para satisfacer los exigentes requisitos térmicos de los procesadores de IA, que continúan aumentando a medida que la tecnología avanza.
La adopción de esta solución no solo responde a las necesidades actuales de los centros de datos de IA, sino que también prepara a estas infraestructuras para futuras demandas tecnológicas y regulatorias. Esta tendencia hacia una mayor eficiencia y sostenibilidad marca un avance crucial en la evolución de las tecnologías de refrigeración en el sector de los centros de datos.
***Montse Vilarrubí Porta es COO de UniSCool.