OpenAI presenta ChatGPT-5 con mejoras en la reducción de alucinaciones pero aún enfrenta desafíos en precisión y competencia

TecnologíaOpenAI

OpenAI presenta ChatGPT-5 con mejoras en la reducción de alucinaciones pero aún enfrenta desafíos en precisión y competencia

OpenAI lanzó ChatGPT-5, la versión más avanzada hasta ahora, con mejoras en precisión y confiabilidad, aunque todavía enfrenta desafíos en comparación con otros modelos.

Descripción

OpenAI anunció la semana pasada el lanzamiento de ChatGPT-5, destacando que es la versión más potente, inteligente, rápida, fiable y robusta de su historia. Durante la presentación, la compañía también enfatizó que este nuevo modelo ofrece una reducción significativa en las alucinaciones, un problema recurrente en los modelos de lenguaje a gran escala (LLM). Sin embargo, las pruebas realizadas por Vectara, una plataforma líder en evaluación de modelos de inteligencia artificial, revelaron que aunque ChatGPT-5 logra una tasa de alucinaciones del 1,4%, menor que la de GPT-4 (1,8%) y variantes como GPT-4 turbo y GPT-4 mini (1,69% y 1,49% respectivamente), todavía presenta una tasa ligeramente superior en comparación con la versión de previsualización ChatGPT-4,5, que alcanza el 1,2%. Modelos como Gemini-2.5-pro (2,6%) y Grok-4 (4,8%) muestran tasas mucho más altas de alucinaciones, evidenciando que ChatGPT-5 mantiene una superioridad en cuanto a precisión.

Además, se ha conocido que XAI, fabricante de Grok, ha recibido críticas por su modo «Spicy» en Grok Imagine, una plataforma que genera vídeos con inteligencia artificial y que ha sido acusada de crear deepfakes inapropiados, incluso sin que los usuarios soliciten contenidos con desnudos o temas sexuales. Esto ha generado controversia sobre las capacidades y la regulación de estas tecnologías.

Por otro lado, OpenAI enfrentó controversias al retirar sin aviso sus modelos previos, incluyendo GPT-4 y sus variantes, para sustituirlos por ChatGPT-5 en las cuentas Plus. La decisión provocó malestar entre la comunidad de usuarios, algunos de los cuales expresaron en redes sociales que «han perdido su único amigo de un día para otro». En respuesta a estas críticas, Sam Altman anunció que se permitirá temporalmente el acceso a GPT-4 mini para las cuentas Plus y afirmó que seguirán monitorizando su uso para determinar cuánto tiempo mantendrán estos modelos legacy disponibles.

Mientras tanto, los datos indican que ChatGPT-5, aunque más preciso en la reducción de alucinaciones, todavía no supera totalmente a modelos especializados en razonamiento profundo, como GPT-3 mini, con una tasa del 0,795%. La competencia en el ámbito de los grandes modelos continúa siendo intensa, con otros modelos como Gemini-2.5-pro y Grok-4 presentando tasas de alucinaciones significativamente más altas. Todo ello plantea un escenario en el que OpenAI continúa innovando, pero también afronta desafíos relacionados con la confianza y la regulación en el uso de inteligencia artificial avanzada.