Estudio revela que las IAs de búsqueda recurren a fuentes menos conocidas y limitan su acceso a información actualizada
Nuevos sistemas de IA en la búsqueda web muestran limitaciones en fuentes y actualización, planteando dudas sobre su fiabilidad comparada con Google.
Cada vez son más las empresas de inteligencia artificial que buscan competir con el motor de búsqueda de Google. Herramientas impulsadas por IA como ChatGPT, Perplexity, Gemini 2.5 Flash, GPT-4 con Search y el propio modo IA de Google han sido desarrolladas para ofrecer respuestas rápidas en la web. Sin embargo, los investigadores se preguntan si estos sistemas realmente superan a la búsqueda tradicional en calidad y fiabilidad.
Recientemente, un estudio titulado «Caracterizando la búsqueda web en la era de la IA generativa» llevó a cabo una evaluación comparativa entre el motor de Google y estos nuevos sistemas impulsados por IA. Para ello, recopilaron 4.606 consultas variadas, procedentes de diferentes conjuntos de datos, incluyendo búsquedas reales en Bing y preguntas hechas a ChatGPT, que abarcan temas desde política y ciencia hasta compras en línea.
Los resultados mostraron que muchos de estos sistemas de IA recurren a fuentes menos conocidas. Por ejemplo, el 53% de los enlaces en las respuestas de la versión de IA de Google provinieron de sitios fuera de las 10 principales páginas de resultados convencionales. Además, el número promedio de sitios web citados por las IA era muy bajo: solo 0,4 sitios por consulta en GPT y 4,1 en GPT-Search, mientras que Gemini y el modo IA de Google citaron en promedio más de ocho sitios.
Otra observación importante es que la longitud de la respuesta influye en la cantidad de fuentes utilizadas: las respuestas más largas suelen incluir más enlaces, lo que evidencia que los modelos no dependen únicamente de su conocimiento interno. Sin embargo, un aspecto crítico que limita la eficacia de estos sistemas es su capacidad para brindar información actualizada. En consultas relacionadas con eventos recientes, como la muerte del exboxeador Ricky Hatton, las IA no lograron proporcionar datos precisos, ya que no tienen acceso a información en tiempo real: solo Gemini alcanzó un 66% de respuestas con datos actuales, mientras que los demás no pudieron responder correctamente.
En una segunda prueba, realizada dos meses después, los sistemas repitieron las mismas consultas para evaluar la coherencia en sus respuestas. La búsqueda tradicional de Google mantuvo un 45% de coincidencia en las fuentes usadas, mientras que Gemini alcanzó un 40% y Google IA solo un 18%. Además, las respuestas no siempre fueron coherentes a lo largo del tiempo, lo que evidencia que los modelos no mantienen un comportamiento dinámico consistente.
Los investigadores concluyen que estas métricas actuales son insuficientes para evaluar adecuadamente la calidad de las búsquedas impulsadas por IA. Recomiendan nuevas metodologías que consideren la diversidad de fuentes, la cobertura temática y el comportamiento en contextos temporales. También destacan la necesidad de integrar un mayor sentido temporal y una adquisición dinámica de información en los sistemas generativos de búsqueda.
Aun así, advierten que su análisis tiene limitaciones, como no haber examinado cómo cambian los resultados en conversaciones prolongadas ni en otros idiomas distintos del inglés. Por ello, señalan que es imprescindible seguir investigando para mejorar la fiabilidad y utilidad de estas tecnologías en la búsqueda de información.