Google DeepMind presenta Sima 2, un avanzado agente de inteligencia artificial con capacidades de comprensión y aprendizaje mejoradas
Google DeepMind anuncia Sima 2, un agente de IA con habilidades superiores para entender instrucciones complejas y aprender de forma autónoma.
Google DeepMind ha presentado Sima 2, su nuevo agente de inteligencia artificial que supone un avance significativo respecto a su modelo anterior, lanzado el año pasado. Mientras que el modelo previo podía seguir hasta 600 instrucciones en juegos comerciales mediante la observación de pantallas y el uso de teclado y ratón, Sima 2 incorpora capacidades mucho más avanzadas, que le permiten entender instrucciones complejas, planificar sus objetivos, comunicarse con los usuarios y aprender de su propia experiencia.
Este nuevo agente es capaz de gestionar tareas más largas y variadas en diferentes entornos, con una mayor capacidad de generalización. Por ejemplo, puede afrontar retos en juegos en los que nunca ha sido entrenado, como Aska o Minedojo, y transferir conocimientos entre diferentes juegos gracias a la integración del modelo Gemini, que le permite comprender instrucciones complejas y aplicar conceptos de un entorno a otro, como usar conocimientos de minería en un juego para tareas de cosecha en otro.
Sima 2 también procesa instrucciones multimodales, incluyendo diagramas en pantalla y comandos en varios idiomas, incluso mediante emojis. Según DeepMind, estas capacidades sitúan al agente cerca del rendimiento de un jugador humano en muchas situaciones. Para su entrenamiento, el agente utilizó demostraciones humanas y datos generados en entornos creados por IA (con Genie 3), que genera mundos 3D interactivos. Gracias a un ciclo de auto-mejora, el sistema le permite adquirir nuevas habilidades sin intervención humana, confiando en la recopilación continua de datos en estos entornos virtuales.
Actualmente, Sima 2 está disponible en versión de «vista de investigación limitada» para un grupo restringido de investigadores y estudios de videojuegos, bajo estrictas normas responsables y evaluaciones de seguridad. Sin embargo, presenta limitaciones, como una memoria todavía reducida, dificultades con tareas extremadamente largas y complejas, así como controles limitados en entornos 3D en los que solo se utilizan teclado y ratón.
Este avance en IA se produce en un contexto en el que Google continúa desarrollando y poniendo a prueba tecnologías innovadoras, como el reciente lanzamiento de una herramienta para Maps que permite convertir ideas en mapas en pocos minutos. De esta forma, la compañía reafirma su compromiso con la investigación responsable y la búsqueda de aplicaciones prácticas en distintos ámbitos. Queda por ver cómo estas capacidades evolucionarán y se integrarán en productos comerciales en un futuro cercano.