Google presenta WebMCP, una interfaz para que agentes de IA interactúen de manera estructurada con páginas web

TecnologíaGoogle

Google presenta WebMCP, una interfaz para que agentes de IA interactúen de manera estructurada con páginas web

Google lanza WebMCP, una interfaz que permite a los agentes de IA comunicarse de forma más eficiente y estructurada con las páginas web.

Descripción

Google ha presentado WebMCP (Protocolo de Contexto de Modelos en la Web), una nueva interfaz de JavaScript diseñada para que los agentes de inteligencia artificial puedan comunicarse de forma estándar con las páginas web. Según explicó André Cipriani Bandarra, desarrollador de Google, WebMCP permite a los agentes interactuar con los sitios web de manera estructurada, eliminando la necesidad de hacer scraping del DOM o navegar manualmente por el código de la página.

Esta interfaz facilita que los agentes automaticen acciones específicas, como completar formularios, buscar productos o reservar vuelos, mediante herramientas que ofrecen mayor rapidez, fiabilidad y precisión. Además, WebMCP amplía el estándar del navegador con un método llamado navigator.modelContext, que incluye funciones como registerTool() y provideContext(), permitiendo la creación y uso de herramientas registradas con descripciones en lenguaje natural, esquemas JSON para las entradas y callbacks para ejecutar las acciones.

Google distingue entre una API declarativa, adecuada para tareas simples como rellenar formularios, y una API imperativa para interacciones complejas con JavaScript. Cada herramienta registrada requiere un nombre, una descripción en lenguaje común, un esquema de entrada y una función de ejecución. Esto permite que los agentes automatizados interactúen de forma más eficiente y estructurada con el contenido web.

WebMCP se ejecuta en el contexto de JavaScript dentro del navegador, sin necesidad de componentes backend adicionales. La iniciativa es resultado de una colaboración entre Google y Microsoft, que trabajan conjuntamente en la estandarización del protocolo en la comunidad Web Machine Learning del W3C. Mientras Microsoft desarrolló NLWeb, una propuesta server-side para convertir las páginas en servidores MCP con interfaces en lenguaje natural, WebMCP se centra en el cliente, operando directamente en el navegador.

Actualmente, WebMCP se encuentra en fase de vista previa temprana, disponible para desarrolladores a través del programa Early Access y en Chrome 146 en modo DevTrial. Se contempla una posible integración futura en Chrome y en servicios de inteligencia artificial de Google, como Gemini, con el objetivo de habilitar a los agentes del navegador para interactuar con las webs de forma más natural y eficiente en un futuro cercano.