¿Qué es una GPU server?

9min

Hay una nueva modalidad de servidores que aportan poderosas capacidades de procesamiento de datos, gracias a su GPU. Te explicaremos qué tienen de diferente con los servidores tradicionales, cuáles son sus ventajas y casos de uso, así como los criterios que puedes tener en cuenta para escoger las mejores características para tu infraestructura, según la tarea que necesites realizar.

Índice

¿Qué es una GPU para servidores?

Para empezar vamos a aclarar en qué consiste una GPU y como funciona en el ámbito de los servidores. GPU son las siglas de Graphics Processing Unit, lo que vendría a significar unidad de procesamiento gráfico. No es más que un componente hardware especializado para trabajo con gráficos, usado tradicionalmente en los ordenadores que requieren realizar renders en 3D o ejecutar juegos con un gran nivel de realismo.

En la actualidad este tipo de dispositivos ha ganado una nueva aplicación en el campo de los servidores, ya que son esenciales para muchas aplicaciones modernas. Así es como ahora podemos hablar también de GPU dentro del contexto de servidores, donde es un componente especializado, diseñado para funcionar de forma continua bajo cargas exigentes, ofreciendo un rendimiento muy elevado y sostenido en el tiempo.

Los servidores GPU, por tanto, ofrecen una elevada capacidad de cómputo que puede usarse en muchas tareas exigentes, que veremos más adelante a modo de casos prácticos, ofreciendo una mejor estabilidad térmica y durabilidad.

Diferencias clave entre GPU de consumo y GPU para centros de datos

Para entender bien qué aporta una GPU en el ámbito de los servidores vamos a explicar las diferencias que hay entre las GPU tradicionales (que encontramos en el sector de consumo) con las GPU específicas para centros de datos.

Rendimiento sostenido y refrigeración en cargas intensivas

Las GPU que encontramos en el sector de consumo, generalmente instaladas en torres construidas para gaming o estaciones de trabajo para modelado 3D y edición de vídeo en alta resolución, están pensadas para realizar trabajos específicos de procesamiento gráfico, en sesiones de uso más cortas, refrigeradas por sistemas tradicionales.

Por otra parte, las GPU que se usan en centros de datos están construidas para operar de manera estable durante largos periodos de uso intensivo con. Esta es la diferencia más importante: la posibilidad de usarlas de manera intensiva sin sufrir caídas de rendimiento por sobrecalentamiento. Además, este tipo de GPU está optimizado para trabajar dentro de racks, con sistemas de ventilación de servidores.

Soporte para virtualización y entornos multiusuario

Además las GPU de servidor tienen una capacidad adicional no presente en las GPU de consumo que consiste en la posibilidad de virtualizarse, para poder dividirse entre múltiples usuarios o máquinas virtuales. A este tipo de GPU se le conoce habitualmente como vGPU y es esencial para que funcionen en entornos empresariales y cloud.

Drivers y optimización para cargas profesionales

Además, las GPU de centros de datos están optimizadas para cargas específicas como deep learning, renderizado, análisis financiero o científico, etc.

¿Por qué es importante la GPU en servidores de IA, renderizado o bases de datos?

Justamente el punto anterior (la optimización para cargas específicas) hace que las GPU de servidor sean esenciales para correr ciertos tipos de aplicaciones, como entrenamiento de la IA o el renderizado 3D. Vamos a ver algunos ejemplos clásicos de uso de este tipo de infraestructura.

Procesamiento paralelo masivo para redes neuronales

El entrenamiento de modelos basados en redes neuronales profundas es uno de los casos de uso más clásicos de los servidores dotados con unidades GPU. Esto es especialmente importante porque este tipo de aplicaciones requiere de cálculos en paralelo muy complejos, que solo son capaces de realizarse de manera adecuada, con el rendimiento y la sostenibilidad necesarios, que nos ofrecen las GPU.

En la actualidad este tipo de infraestructura ha adquirido mucha importancia por la irrupción de la IA en numerosos ámbitos.

Aceleración del renderizado 3D y simulaciones gráficas

Otro escenario especialmente crítico es el renderizado de 3D, en industrias como el cine, la arquitectura o la automoción. Este tipo de servidores con GPU server permiten renderizar escenas 3D complejas en tiempos mucho menores que las de las CPU tradicionales.

Optimización del análisis de datos y big data

Además, son esenciales también para el análisis y procesamiento de grandes volúmenes de datos. Gracias a la capacidad de cómputo paralelo de las GPU se pueden realizar cálculos complejos, agregaciones o simulaciones estadísticas de manera más eficiente.

Menor latencia y mayor eficiencia en entornos críticos

Las GPU también son esenciales en sectores donde sea muy importante una capacidad de análisis de datos en tiempo real, como las finanzas o la investigación científica. En estos casos las GPU ofrecen la posibilidad de minimizar la latencia y maximizar la eficiencia energética aún con operaciones intensivas.

Factores técnicos que influyen en su rendimiento (VRAM, núcleos CUDA, TDP…)

Aparte de las propias GPU, también existen algunos factores técnicos que deben ser tenidos en cuenta a la hora de construir un servidor de GPU. Los más importantes son estos:

Memoria VRAM

La VRAM es la memoria dedicada al vídeo y determina la cantidad de datos que una GPU puede cargar y procesar sin necesidad de intercambiar constantemente información con la memoria principal del servidor. En tareas de IA o renderizado, es esencial disponer de mucha VRAM, ya que permite manejar modelos más grandes o escenas más complejas.

Núcleos CUDA o Stream Processors

Los núcleos CUDA son las unidades de ejecución paralela que tiene una GPU, en las GPU de NVIDIA. Por su parte, las GPU de AMD este mismo concepto se denomina Stream Processors. Pues bien, a mayor cantidad de estos elementos, mayor es la capacidad de procesamiento paralelo de las GPU, algo fundamental para conseguir cubrir con los casos de uso de este tipo de infraestructuras.

TDP y eficiencia energética en entornos de servidores

También es fundamental para este tipo de instalaciones tener un buen diseño de TDP, siglas de Thermal Design Power. Esto es importante porque este diseño indica la cantidad de calor que la GPU genera y que por tanto debe disiparse para un funcionamiento correcto del sistema. En servidores, es crucial mantener un equilibrio entre potencia y eficiencia energética, ya que un alto TDP implica mayores necesidades de refrigeración y también nos lleva a un mayor consumo eléctrico.

Soporte para interconexiones como NVLink o PCIe Gen5

Luego tenemos algunas tecnologías asociadas como los NVLink, que permiten interconectar múltiples GPU con mayor ancho de banda que el PCIe tradicional. Esto es algo especialmente importante porque mejora la escalabilidad de las instalaciones y la velocidad de comunicación entre las GPU y otros componentes del sistema.

Criterios para elegir una GPU para servidor

En el caso que estés evaluando la contratación de un servidor con GPU, porque tus necesidades de procesamiento sean especialmente ambiciosas, te recomendamos seguir los siguientes criterios para escoger correctamente.

Uso previsto

Lo primero que tenemos que pensar es el tipo de trabajo que pretendemos realizar con el servidor.

  • IA y machine learning: este tipo de operaciones requiere mucha capacidad de procesamiento y gran paralelismo.
  • Renderizado y simulación: aquí, aparte de un alto rendimiento gráfico necesitaremos mucha memoria VRAM.
  • Virtualización: exige GPUs que soporten múltiples sesiones o usuarios virtualizados (vGPU).
  • Bases de datos o análisis de datos: en este caso se necesita un buen balanceo de  eficiencia y optimización en tareas numéricas y de memoria.

Compatibilidad con la infraestructura del servidor (rack, consumo, drivers)

Tienes que ver qué tipo de GPU es compatible con el tipo de servidor, atendiendo a factores como:

  • Espacio físico y formato del servidor (rack 1U, 2U…)
  • Fuente de alimentación disponible y TDP máximo soportado por la fuente
  • Compatibilidad con el sistema operativo que pretendamos usar, o por los hipervisores o drivers necesarios
  • Soporte para refrigeración activa o pasiva, según el entorno donde serán instalados

Presupuesto y escalabilidad a futuro

Obviamente, también qué presupuesto tenemos disponible para la compra de las GPU y las necesidades de escalabilidad a futuro. Para poder escoger bien necesitas saber si se pueden añadir más GPUs más adelante, así como el coste de licencias NVIDIA para vGPU.

¿Qué GPU elegir según tu necesidad?

Ahora vamos a ver algunos ejemplos de GPU que pueden funcionar bien para distintas necesidades específicas de los casos de uso típicos que hemos señalado antes.

GPU ideales para servidores de Inteligencia Artificial y machine learning

Para entrenar modelos de IA, redes neuronales profundas y machine learning las GPU más recomendables tendrían estas características:

  • GPU con gran número de núcleos CUDA o tensor cores
  • VRAM de 24 GB o más
  • Soporte NVLink para para entrenamiento distribuido

Algunos modelos que cubren estas características serían NVIDIA A100 H100, L40 o RTX 6000. En AMD se podría usar el modelo Instinct MI250.

GPU recomendadas para servidores de renderizado y simulación gráfica

En entornos de producción audiovisual o para arquitectura necesitamos GPU con características como estas:

  • Alta capacidad gráfica y elevado VRAM
  • Compatibilidad con motores de renderizado usados en la industria, como Octane, Redshift, V-Ray…
  • Drivers profesionales certificados como los que ofrece la gama  NVIDIA RTX A

En este segmento la recomendación seria NVIDIA RTX A6000 o NVIDIA L40. Por su parte, AMD sería el modelo Radeon Pro W6800 o MI210.

Qué GPU usar en servidores para virtualización o entornos multiusuario

Para entornos multiusuario o infraestructura de escritorio virtual sería ideal contar con estas características:

  • Soporte para vGPU y partición de recursos
  • Licenciamiento empresarial

Algunas recomendaciones son NVIDIA A16, A10 o A40. En AMD recomendamos MI300 series.

Fernando Fuentes

Productos relacionados: