Análisis del rendimiento de AMD EPYC 4545P para cargas de trabajo de servidores dedicados

Análisis del rendimiento de AMD EPYC 4545P para cargas de trabajo de servidores dedicados - Imagen principal

El servidor dedicado ExtremeInMotion Hosting es la primera oferta de servidores gestionados basados en AMD de la empresa, y la elección del procesador es más importante de lo que sugiere la marca. El AMD EPYC 4545P, basado en la arquitectura Zen 4 de AMD, ofrece características arquitectónicas que benefician directamente a las bases de datos, los análisis y las cargas de trabajo que requieren un uso intensivo de memoria, habituales en la infraestructura de los servidores dedicados. Comprender cuáles son esas características y a qué cargas de trabajo benefician más te ayudará a evaluar si las especificaciones del nivel Extreme se ajustan a tus necesidades reales.

Especificaciones de EPYC 4545P

EspecificaciónValor
ArquitecturaAMD Zen 4 (TSMC 5 nm)
Número de núcleos16 núcleos / 32 hilos
Reloj base3,0 GHz
Reloj de impulso máximo5,4 GHz
Caché L364 MB
Apoyo a la memoriaDDR5-4800, hasta 192 GB
Canales de memoria4 canales
TDP65W
Conjuntos de instruccionesAVX-512, AES-NI, SHA

El TDP de 65 W es notable para un procesador de servidor de 16 núcleos. Los procesadores Intel Xeon Silver de la generación anterior con un número de núcleos comparable tenían un TDP de 105-150 W. Un menor consumo de energía con una capacidad de cálculo equivalente se traduce directamente en menores costos de energía para los centros de datos, lo cual es relevante para las implementaciones de coubicación y contribuye a la capacidad de InMotion para ofrecer esta configuración a precios competitivos.

Ventajas de la arquitectura Zen 4

Caché L3: 64 MB y por qué es importante

La caché L3 de 64 MB del EPYC 4545P es grande para los estándares de los procesadores de servidor. En el caso concreto de las cargas de trabajo de bases de datos, el tamaño de la caché L3 determina la cantidad de datos de trabajo que permanecen en la caché entre consultas. Un índice al que se accede con frecuencia o una partición activa de una PostgreSQL que cabe en la caché L3 se sirve en 4-40 nanosegundos. Los mismos datos a los que se accede desde la RAM DDR5 tardan entre 60 y 80 nanosegundos.

Esa diferencia se acumula en millones de consultas al día. Las cargas de trabajo con gran volumen de bases de datos, el procesamiento de transacciones OLTP, los backends de aplicaciones web y los sistemas ERP obtienen beneficios tangibles en cuanto a latencia gracias a una gran caché L3. Esta es una de las razones por las que el EPYC 4545P ofrece un buen rendimiento en las pruebas de referencia de bases de datos en comparación con procesadores con más núcleos pero con menos asignaciones de caché por núcleo.

Controlador de memoria DDR5

El controlador de memoria DDR5 integrado del EPYC 4545P admite DDR5 de 4 canales a 4800 MT/s, lo que proporciona un ancho de banda de memoria teórico de aproximadamente 153 GB/s. La DDR4 con el mismo número de canales alcanza un máximo de entre 100 y 110 GB/s. Para cargas de trabajo limitadas por el ancho de banda de la memoria, ese aumento teórico del 40 % en el ancho de banda se traduce en diferencias significativas en el rendimiento real.

Las cargas de trabajo que más se benefician de un mayor ancho de banda de memoria: grandes grupos de búferes de bases de datos en memoria (Redis, Memcached, PostgreSQL grandes shared_buffers), cálculos científicos con operaciones matriciales de gran tamaño, simulaciones numéricas y cargas de trabajo analíticas que escanean grandes conjuntos de datos que permanecen en la RAM. Para cargas de trabajo dependientes de la CPU, como el procesamiento de solicitudes web o el cálculo de datos pequeños, el ancho de banda de la memoria rara vez es el cuello de botella.

Conjunto de instrucciones AVX-512

AVX-512 (Advanced Vector Extensions 512-bit) procesa 512 bits de datos por ciclo de reloj para operaciones de coma flotante, el doble de los 256 bits que maneja AVX-256. Para las aplicaciones creadas para utilizar AVX-512, esto duplica el rendimiento de coma flotante por ciclo de reloj.

Software que se beneficia directamente de AVX-512 en el EPYC 4545P:

  • NumPy / SciPy: Compilado con Intel MKL o OpenBLAS AVX-512, las operaciones matriciales se ejecutan al doble de rendimiento que con AVX-256.
  • TensorFlow / PyTorch (CPU): Ambos marcos detectan y utilizan AVX-512 para operaciones tensoriales de CPU. El rendimiento de inferencia de la CPU para redes neuronales pequeñas aumenta significativamente.
  • Codificación de vídeo (FFmpeg): los códecs optimizados para AVX-512 (AV1, H.265) codifican más rápido por núcleo en procesadores compatibles con AVX-512.
  • Compresión de bases de datos: PostgreSQL MySQL utilizan instrucciones SIMD para la compresión de datos; AVX-512 acelera estas operaciones.
  • Criptografía: la aceleración AES-NI y SHA en el hardware EPYC reduce la sobrecarga del protocolo TLS para servidores web con altas tasas de conexión.

Rendimiento de un solo núcleo frente al rendimiento multinúcleo

Cuando la velocidad del núcleo único es importante

La frecuencia turbo de 5,4 GHz del EPYC 4545P es competitiva para cargas de trabajo de servidores de uso general. El rendimiento de un solo núcleo es más importante para:

  • Procesamiento de solicitudes PHP-FPM: cada solicitud se ejecuta dentro de un único proceso de trabajo, por lo que el tiempo de generación de la página se mide directamente con el rendimiento de un solo núcleo, y no con el recuento total de núcleos.
  • Procesamiento de comandos Redis: Redis ejecuta los comandos en un solo subproceso, lo que significa que una velocidad de reloj por núcleo más rápida reduce la latencia por comando en todos los clientes conectados a la instancia.
  • Las consultas secuenciales a bases de datos que no pueden paralelizarse se benefician de ciclos de reloj individuales más rápidos, en particular los procedimientos almacenados y las consultas generadas por ORM que se ejecutan como una única cadena serie.
  • La lógica del servidor del juego en la mayoría de los motores ejecuta la simulación física y las actualizaciones del estado del juego en un solo subproceso, lo que convierte la velocidad del reloj por núcleo en la principal palanca de rendimiento.
  • Las aplicaciones heredadas escritas antes de que el multihilo fuera habitual suelen saturar un solo núcleo y no obtienen ningún beneficio de los núcleos adicionales, independientemente del número total.

Para estas cargas de trabajo, la frecuencia de impulso de hasta 5,4 GHz garantiza que las operaciones individuales se completen rápidamente. Las mejoras de la arquitectura Zen 4 en cuanto a IPC (instrucciones por ciclo de reloj) por núcleo con respecto a Zen 3 hacen que el rendimiento efectivo de un solo subproceso sea mayor de lo que sugiere la velocidad del reloj por sí sola.

Donde 16 núcleos marcan la diferencia

Las cargas de trabajo que utilizan varios núcleos simultáneamente aprovechan al máximo las ventajas del procesamiento de 16 núcleos y 32 subprocesos:

  • Compilación paralela con make -j16 distribuye la compilación de archivos de objetos entre los 16 núcleos simultáneamente, lo que reduce el tiempo de reconstrucción completa del código base de minutos a segundos en proyectos grandes.
  • Los servidores web bajo carga simultánea generan múltiples procesos Nginx o trabajadores de grupo PHP-FPM en paralelo, cada uno de los cuales gestiona una conexión independiente; 16 núcleos sostienen cientos de solicitudes simultáneas sin colas.
  • El paralelismo de consultas de bases de datos en los planes de consultas paralelas PostgreSQLy la replicación paralela de MySQL distribuyen el trabajo entre los núcleos disponibles, lo que reduce directamente el tiempo de ejecución de las consultas en conjuntos de datos de gran tamaño.
  • La transcodificación de vídeo con FFmpeg envía múltiples tareas de codificación simultáneamente; 16 núcleos gestionan codificaciones H.265 o AV1 en paralelo a un ritmo que una máquina de 4 núcleos no puede alcanzar.
  • Los marcos de aprendizaje automático, incluidos XGBoost, LightGBM y scikit-learn, utilizan OpenMP para paralelizar el entrenamiento de modelos en todos los núcleos disponibles, lo que reduce el tiempo de entrenamiento de forma proporcional al número de núcleos.
  • La orquestación de contenedores en más de 16 servicios contenedorizados significa que cada servicio obtiene un margen de CPU dedicado en lugar de competir con los vecinos por un grupo compartido.

EPYC 4545P frente a Intel Xeon de la generación anterior para cargas de trabajo comunes

Categoría de carga de trabajoVentajas de EPYC 4545PNotas
Base de datos (PostgreSQL)Mayor ancho de banda de memoria + caché L3 más grandeMejores tasas de acierto del grupo de búferes, mayor rendimiento de las consultas
Almacenamiento en caché en memoria (Redis)Ventaja del ancho de banda DDR5 para grandes conjuntos de datosMás relevante para conjuntos de datos que se acercan a la capacidad de memoria.
Compilación paralelaComparable a Intel Xeon con un número similar de núcleos.Ambos gestionan compilaciones paralelas de manera eficiente.
Servicio web (PHP/Node.js)Competitivo; AES-NI reduce la sobrecarga de TLS.Lo más importante aquí es la frecuencia de impulso de un solo núcleo.
Computación científicaCombinación de ancho de banda AVX-512 + DDR5Importante para el cálculo numérico vectorizado.
Eficiencia energética65 W TDP frente a 105-150 W para un Xeon comparable.Menor consumo energético por unidad de cálculo

RAM ECC: por qué se incluye en este análisis

El servidor dedicado Extreme se suministra con RAM DDR5 ECC, no con DDR5 estándar. Se trata de una especificación importante para las cargas de trabajo de producción, más allá de las comparaciones típicas de alojamiento.

La memoria RAM ECC (código de corrección de errores) detecta y corrige automáticamente los errores de memoria de un solo bit y detecta (pero no puede corregir) los errores de varios bits. Según estudios del sector, los errores de bits de la DRAM se producen a una tasa aproximada de 1 error por cada 1 GB de RAM al año en memorias de consumo sin ECC. En un sistema de 192 GB, eso supone aproximadamente 192 posibles errores de bits al año.

Un error de un solo bit en un grupo de búferes de base de datos provoca la corrupción de los datos. En una aplicación financiera, es posible que esa corrupción no sea visible de inmediato, pero que aparezca más tarde en forma de errores de cálculo o fallos en la integridad de los datos. La RAM ECC corrige silenciosamente estos errores antes de que se propaguen. Por este motivo, es un equipamiento estándar en el hardware de los servidores empresariales.

Cómo posiciona InMotion el EPYC 4545P

InMotion es uno de los primeros proveedores de alojamiento gestionado en ofrecer el AMD EPYC 4545P en una configuración de servidor dedicado totalmente gestionado a este precio. El posicionamiento es específico: los servidores dedicados gestionados con una capacidad de memoria comparable (192 GB) de los proveedores de alojamiento empresarial han costado históricamente entre 600 y 1200 dólares al mes. El nivel Extreme ofrece esas especificaciones con la capa de gestión APS InMotion Hostingincluida.

El TDP de 65 W del EPYC 4545P es uno de los factores que hacen posible ese precio. El menor consumo energético a nivel de centro de datos permite a InMotion ofrecer una mayor densidad de cálculo a un precio gestionado que compite con el bare metal «hágalo tú mismo» en las instalaciones de coubicación.

Cargas de trabajo más adecuadas para el EPYC 4545P

  • Implementaciones de bases de datos grandes: 192 GB de DDR5 ECC + 64 MB de caché L3, diseñado específicamente para implementaciones grandes de MySQL, PostgreSQL y MongoDB en las que el conjunto de datos de trabajo cabe en la memoria.
  • Análisis con uso intensivo de memoria: Spark, el procesamiento de datos en memoria y las operaciones con grandes conjuntos de datos se benefician del ancho de banda DDR5 y la capacidad de 192 GB.
  • Sistemas de compilación paralela y CI: 16 núcleos gestionan la ejecución de pruebas en paralelo y las compilaciones de Docker sin colas.
  • Aplicaciones web de alta concurrencia: 16 núcleos sostienen cientos de trabajadores PHP-FPM concurrentes o procesos de clúster Node.js.
  • Aprendizaje automático (limitado por la CPU): AVX-512 + 16 núcleos aceleran XGBoost, scikit-learn y la inferencia de la CPU.

Cargas de trabajo en las que las ventajas específicas del EPYC 4545P importan menos: aplicaciones puramente de un solo subproceso en las que la frecuencia de impulso (5,4 GHz) es competitiva, pero no muy diferente de las alternativas, y cargas de trabajo dependientes de la GPU en las que la CPU no es el cuello de botella.

Obtén el rendimiento de AMD para tu carga de trabajo

El servidor dedicado Extreme de InMotion combina un procesador AMD EPYC 4545P con 192 GB de RAM DDR5 y un ancho de banda ampliable a 10 Gbps, diseñado para aplicaciones de streaming, API y CRM que requieren capacidad de ampliación.

Elige un alojamiento totalmente gestionado con Premier Care para disfrutar de una administración experta o un bare metal autogestionado para tener un control total.

Explora el Plan Extremo

¿Qué cargas de trabajo se benefician realmente de este procesador?

Las especificaciones de los procesadores rara vez son fáciles de entender, pero el EPYC 4545P se basa en una filosofía de diseño coherente: maximizar lo que realmente supone un cuello de botella para las cargas de trabajo de los servidores. La caché L3 de 64 MB mantiene los conjuntos de trabajo de bases de datos activas fuera del bus de memoria. La DDR5, con un ancho de banda teórico de 153 GB/s, alimenta las capas de análisis y almacenamiento en caché en memoria sin ralentizar el sistema. El TDP de 65 W ofrece 16 núcleos de computación Zen 4 con un consumo de energía que habría parecido imposible para este número de núcleos hace tres años.

Nada de eso significa que sea el procesador adecuado para todas las cargas de trabajo. Las aplicaciones puramente de un solo subproceso obtendrán resultados competitivos, pero no transformadores. El aprendizaje automático dependiente de la GPU pasa por alto la mayor parte de lo que hace que este chip sea interesante. Pero para las cargas de trabajo que llenan la mayoría de los entornos de servidores dedicados de producción, concretamente las grandes bases de datos relacionales, las aplicaciones web de alta concurrencia, los sistemas de compilación paralela y los análisis en memoria, la arquitectura del EPYC 4545P se adapta directamente a los cuellos de botella que esas cargas de trabajo encuentran en primer lugar.

El ECC DDR5 es tan importante como la elección del procesador para las implementaciones de producción. Un sistema sin ECC de 192 GB que ejecuta una base de datos financiera o una plataforma SaaS multitenant conlleva un riesgo real para la integridad de los datos a gran escala. El servidor dedicado Extreme se suministra con ECC de serie, no como complemento.

Por 439,98 $ al mes con gestión completa incluida, el nivel Extreme de InMotion fija el precio del EPYC 4545P en un mercado en el que la capacidad de memoria gestionada comparable ha costado históricamente entre 600 y 1200 $ al mes. Esa diferencia existe gracias al TDP de 65 W, y no a pesar de él. Un menor consumo de energía por unidad de computación cambia la economía del alojamiento gestionado en este nivel de especificaciones.

Si tu infraestructura actual está alcanzando los límites de memoria, la latencia de las consultas a la base de datos está aumentando con el tamaño del conjunto de datos o las cargas de trabajo paralelas se están acumulando en una CPU que se ha quedado sin margen, vale la pena comparar directamente el EPYC 4545P con tu configuración actual. Las especificaciones son lo suficientemente concretas como para evaluarlas en función de tu carga de trabajo real, no solo como una afirmación de marketing.

Comparte este artículo

Deja una respuesta

Tu dirección de correo electrónico no se publicará. Los campos obligatorios están marcados con *.