Google y DeepMind desarrollan Gemini, un asistente de inteligencia artificial proactivo con funciones en tiempo real y memoria activa

TecnologíaGoogle

Google y DeepMind desarrollan Gemini, un asistente de inteligencia artificial proactivo con funciones en tiempo real y memoria activa

Google y DeepMind avanzan en Gemini, un asistente que combina visión en tiempo real, memoria activa y capacidades proactivas para facilitar tareas diarias.

Descripción

El equipo de inteligencia artificial de Google, en colaboración con DeepMind, está desarrollando un proyecto llamado Proyecto Astra, cuyo objetivo es crear una inteligencia artificial universal capaz de asistir en tareas a largo plazo y con memoria activa. Una de las funciones más destacadas de esta iniciativa es Gemini, un asistente que puede acceder en tiempo real a la cámara y a los contenidos en pantalla para identificar problemas, ofrecer soluciones y recordar información previamente almacenada del usuario.

Durante la conferencia Google I/O, la compañía mostró avances en estas tecnologías, demostrando cómo Gemini puede ayudar en tareas cotidianas como reparaciones caseras, búsqueda de vídeos instructivos, llamadas a tiendas y apoyo en tareas educativas, con interacciones proactivas y asistencia en procesos diarios. Estas funciones buscan que Gemini sea proactivo, alertando y ayudando automáticamente según las necesidades del usuario, por ejemplo, buscando instrucciones en archivos PDF o asistiendo en actividades de aprendizaje.

Para que estas funciones sean realmente útiles, requieren acceso a una gran cantidad de datos del usuario, lo que implica riesgos y la necesidad de confiar en Google. Aunque se trabaja en el procesamiento local en los dispositivos, la capacidad sigue siendo limitada, por lo que gran parte de la inteligencia artificial dependerá del acceso a la información en la nube. Google busca equilibrar la utilidad de sus asistentes con la protección de la privacidad del usuario, fomentando procesos más locales para mitigar riesgos.

Se espera que, mediante la incorporación de agentes que actúan de forma proactiva, Gemini pueda anticiparse a las necesidades de la ciudadanía, realizando tareas como buscar instrucciones, ajustar calendarios o gestionar llamadas automáticamente. Un ejemplo presentado muestra a un usuario solicitando ayuda para reparar una bicicleta, con Gemini navegando documentos PDF para localizar la sección adecuada o incluso llamando a tiendas para consultar la disponibilidad de piezas, usando la cámara y funciones de realidad aumentada para facilitar la interacción.

También se demostró cómo Gemini puede asistir en el aprendizaje, ayudando a resolver tareas escolares y corrigiendo errores paso a paso. La integración de estas capacidades representa un avance hacia un asistente más inteligente que combina reconocimiento de lenguaje natural con funciones de delegación y búsqueda activa de información en múltiples plataformas, incluidos vídeos y contactos telefónicos.

Sin embargo, la implementación de estas funciones aún no tiene una fecha concreta y su éxito dependerá de la capacidad de Gemini para gestionar grandes volúmenes de datos de manera segura y eficiente. Aunque Google trabaja para que el procesamiento se realice cada vez más en el dispositivo, por ahora muchas funciones dependen del análisis en la nube, lo que pone de relieve la importancia y los riesgos asociados a la confianza en la privacidad del usuario. Todo esto señala un futuro en el que los asistentes virtuales serán más integrados y proactivos en la vida diaria, pero con la precaución de que se requiere un equilibrio cuidadoso entre utilidad y protección de datos.