OpenAI lanza GPT-4.1, una actualización enfocada en razonamiento lógico y codificación con respuestas más detalladas

TecnologíaOpenAI

OpenAI lanza GPT-4.1, una actualización enfocada en razonamiento lógico y codificación con respuestas más detalladas

OpenAI presenta GPT-4.1, una versión que mejora el razonamiento lógico y la codificación, ofreciendo respuestas más estructuradas y detalladas en diversos desafíos.

Descripción

OpenAI lanzó silenciosamente GPT-4.1 para ChatGPT, una actualización que representa una mejora significativa, centrada especialmente en el razonamiento lógico y la codificación. Con una ventana de contexto mucho mayor y una comprensión más estructurada, esta versión promete abrir nuevas posibilidades en programación y resolución de acertijos. Sin embargo, OpenAI suele destacar las habilidades de sus modelos en codificación, un aspecto que puede resultar menos interesante para usuarios no especializados.

Para evaluar sus capacidades, se realizó una comparación entre GPT-4.1, GPT-4o (el modelo predeterminado de ChatGPT) y GPT-o3, un modelo diseñado para resolver matemáticas, códigos y puzzles mediante razonamiento profundo. La prueba consistió en resolver una serie de acertijos y puzzles lógicos, incluyendo un clásico en el que había que encontrar un gato escondido en cinco cajas, siguiendo una estrategia deducible que garantizaba capturarlo independientemente de su posición inicial. GPT-4.1 planteó una solución determinista, simulando paso a paso los movimientos del gato y explicando detalladamente cada decisión, demostrando un razonamiento claro y estructurado.

El modelo GPT-o3, aunque tardó 22 segundos en pensar su respuesta, propuso una estrategia similar pero con un estilo más extenso y elaborado, calculando que podía encontrar al gato en un máximo de cinco días. Por su parte, GPT-4o se mostró más directo, explicando brevemente el método de «seguir y perseguir», sin entrar en demasiados detalles. En cuanto a un segundo acertijo, un problema de física sobre determinar cuánta cantidad de vino hay en un barril sin medirlo, GPT-4.1 respondió de forma sencilla e intuitiva, sugiriendo inclinar el barril y observar si el fondo se ve o no para determinar si el vino está por encima o por debajo de la mitad.

El modelo GPT-o3 también resolvió el acertijo con breves puntos en su explicación, enfatizando la inclinación del barril y la ausencia de instrumentos para medir. GPT-4o proporcionó una respuesta similar en forma de puntos, pero con un análisis más detallado de la física subyacente. En un último reto, basado en un juego de palabras, las inteligencias artificiales tuvieron que identificar qué ocurre una vez en un minuto, dos veces en un momento y nunca en un milenio. Aquí, GPT-4.1 explicó con claridad que la respuesta está en la letra «m», mostrando cómo esa letra aparece en «minute» y «moment», pero no en «a thousand years». GPT-o3 también dio una respuesta en forma de lista, limitándose a contar las apariciones de la letra, mientras que GPT-4o, aunque de forma más breve, proporcionó un análisis que involucraba la interpretación literal de la palabra.

Tras estos experimentos, se concluye que todos los modelos demuestran un buen entendimiento en lógica y razonamiento. La diferencia principal radica en la extensión y claridad de las respuestas, siendo GPT-4.1 la que presenta las explicaciones más detalladas y coherentes. Por ello, se recomienda GPT-4.1 para tareas que requieran resolución de problemas lógicos y programación, aunque cualquiera de los modelos puede resolver acertijos de forma eficaz. En definitiva, todos resultan útiles para potenciar la inteligencia artificial en problemas que demandan razonamiento estructurado y deducción.