Miles de conversaciones de ChatGPT quedaron accesibles en Internet Archive y Google, generando preocupaciones sobre la privacidad
Se revelan riesgos en la privacidad digital al filtrarse miles de conversaciones de ChatGPT en archivos accesibles públicamente.
Recientemente se ha revelado que miles de conversaciones compartidas en la app de ChatGPT estaban accesibles a través de Google y el Internet Archive. La opción llamada «Make this chat discoverable» permitía que estas conversaciones fueran indexadas y disponibles para búsquedas públicas, lo que generó preocupación entre la ciudadanía por la seguridad de su información personal.
El periodista de investigación Henk van Ess informó en su perfil de X (antes Twitter) que más de 100.000 conversaciones de ChatGPT estaban almacenadas en Archive.org, donde las personas usuarias podían buscarlas fácilmente mediante la URL chatgpt.com/share. De acuerdo con su análisis, se detectaron en total unas 110.000 conversaciones disponibles a través de la Wayback Machine, un archivo digital que captura y mantiene copias de sitios web. Aunque inicialmente Archive.org no había recibido una solicitud formal de OpenAI para retirar estos enlaces, la plataforma aparentemente ha eliminado dichas conversaciones, mostrando actualmente un mensaje que indica que las URLs han sido excluidas de la indexación.
Van Ess también señaló que ChatGPT eliminó de forma silenciosa casi 50.000 conversaciones compartidas que estaban en el índice de Google tras el desarrollo de esta investigación, aunque advirtió que esta no fue una solución definitiva. La existencia de estas conversaciones en la Wayback Machine plantea preguntas sobre otros posibles archivos y sobre qué sitios adicionales podrían haber almacenado este tipo de datos, así como las políticas de eliminación que cada uno aplica.
Es importante destacar que en la plataforma de Archive.org, las personas titulares del contenido tienen la posibilidad de solicitar que sus sitios sean removidos del índice. Sin embargo, otros archivos en línea y sitios web pueden tener políticas distintas, y también existe la posibilidad de que actores malintencionados hayan accedido y almacenado estas conversaciones sin autorización.
Respecto a OpenAI, la compañía ya tomó medidas para eliminar estas conversaciones del índice de Google y también eliminó la opción en la app para hacer que los chats sean «discoverable», es decir, accesibles públicamente. Con estas acciones, las nuevas conversaciones ya no podrán ser compartidas de manera que sean encontradas por buscadores, aunque la preocupación sobre la exposición de datos sensibles persiste.
Por ello, las recomendaciones para la ciudadanía siguen siendo claras: no compartir información personal o confidencial en las conversaciones con inteligencias artificiales, ya que estos diálogos pueden ser utilizados para entrenar modelos y, en algunos casos, visualizados por moderadores o almacenados por terceros, incluso por actores malintencionados. La protección de la privacidad en línea continúa siendo una prioridad, y es fundamental tomar precauciones ante la exposición accidental de datos sensibles en plataformas digitales.