Problema en GPUs GeForce RTX 5090 y RTX Pro 6000 de Nvidia afecta sistemas de virtualización, requiriendo reinicio completo

TecnologíaNvidia

Problema en GPUs GeForce RTX 5090 y RTX Pro 6000 de Nvidia afecta sistemas de virtualización, requiriendo reinicio completo

Nuevos problemas en las GPUs Blackwell de Nvidia complican la virtualización, exigiendo reinicios completos y generando bloqueos en las tarjetas afectadas.

Descripción

Las GPUs GeForce RTX 5090 y RTX Pro 6000, de la generación Blackwell de Nvidia, presentan un problema que afecta a los sistemas de virtualización y requiere un reinicio completo del sistema host para que se reconozcan correctamente. Este fallo provoca que las tarjetas gráficas se queden bloqueadas tras reiniciar las máquinas virtuales, mostrando un error que indica: «not ready 65535ms after FLR». Esto significa que, después de un Function-Level Reset (FLR), la GPU no responde como debería.

El problema ha sido detectado por CloudRift en múltiples instalaciones que utilizan sistemas Blackwell, además de haber sido reportado por usuarios en comunidades como Proxmox y Level1Techs. Es importante destacar que este fallo no afecta a tarjetas de generaciones anteriores, como la GeForce RTX 4090, lo que sugiere que el error está limitado a la familia Blackwell.

El error se presenta cuando las GPUs, al someterse a un reset mediante FLR, quedan inoperables y aparecen como «unknown header type 7f» en la consulta PCI-Express con la herramienta lspci. En estos casos, las tarjetas permanecen inhabilitadas y no se recuperan sin un reinicio completo del sistema, lo que puede afectar la estabilidad y operatividad de entornos virtualizados.

Hasta el momento, Nvidia no ha emitido declaraciones oficiales sobre este fallo. En respuesta, CloudRift ha ofrecido una recompensa de hasta 1.000 $ a quienes aporten información que ayude a identificar la causa o la solución del problema. La comunidad afectada continúa vigilando la situación, ante la incertidumbre sobre posibles actualizaciones o parches futuros que solucionen esta vulnerabilidad en la serie Blackwell.