Modelos de inteligencia artificial de DeepMind y OpenAI logran corregir preguntas de la Olimpiada Internacional de Matemáticas sin preparación previa
Avances en inteligencia artificial permiten a modelos de DeepMind y OpenAI resolver preguntas matemáticas complejas en competencia internacional, sin preparación previa.
Recientes avances en inteligencia artificial han demostrado que los modelos de DeepMind, de Google, y OpenAI respondieron correctamente a cinco de seis preguntas en una prueba de matemáticas de alto nivel, sin haber sido preparadas previamente. Este logro representa un avance importante respecto a la edición anterior, en la que Google utilizó modelos como AlphaProof y AlphaGeometry, que requerían que las tareas fueran traducidas por humanos para ser interpretadas por las máquinas.
La prueba en cuestión fue la Olimpiada Internacional de Matemáticas (IMO), un concurso anual que reúne a estudiantes de todo el mundo y premia con medallas de oro a los participantes destacados. En esta ocasión, tanto DeepMind, con su modelo Gemini, como OpenAI, con su modelo X, participaron bajo las mismas condiciones que los estudiantes: seis preguntas en 4,5 horas y un puntaje máximo de 42. Ambos modelos lograron 35 puntos, superando ampliamente a la mayoría de los estudiantes evaluados en el concurso.
El modelo de DeepMind, denominado Advanced Gemini with Deep Think, abordó las tareas no siguiendo simplemente una cadena lineal de razonamiento, sino considerando múltiples caminos hacia la solución. Además, contó con acceso a una base de datos curada de problemas y soluciones matemáticas, lo que le permitió reforzar su desempeño en la prueba. Por su parte, OpenAI, mediante su modelo X, también alcanzó 35 puntos en iguales condiciones, sin que fuera necesario preparar o adaptar previamente las preguntas para las máquinas.
Este logro ha sido destacado como un paso significativo hacia la creación de inteligencia artificial general (AGI), al demostrar que estas capacidades funcionan no solo en entornos controlados, sino también en pruebas rigurosas y abiertas a la participación humana. Sin embargo, esta noticia no estuvo exenta de controversia; el CEO de DeepMind, Demis Hassabis, expresó su descontento en redes sociales, criticando que OpenAI difundiera los resultados antes de que estudiantes y expertos independientes verificaran la veracidad de los logros.
Con estos avances, la competencia en el desarrollo de IA más avanzada se intensifica, y el interés en aplicaciones específicas, como los modelos destinados a resolver complejos problemas matemáticos, sigue en aumento. Todo indica que estamos en la antesala de una era en la que las máquinas podrán demostrar habilidades intelectuales similares o superiores a las humanas en ámbitos fundamentales para el progreso tecnológico y científico.