Modelos de ChatGPT de OpenAI vulnerables a ataques que facilitan instrucciones peligrosas a pesar de sus barreras de seguridad

A pesar de sus barreras de seguridad, modelos de ChatGPT aún pueden ser manipulados para generar instrucciones peligrosas, según recientes investigaciones.

Publicado: 10-10-2025 12:10

OpenAI ha desarrollado modelos de ChatGPT con barreras de seguridad conocidas como «guardrails», diseñadas para impedir que los usuarios generen información potencialmente peligrosa, como instrucciones para crear armas biológicas o nucleares. Sin embargo, estos sistemas no son completamente inmunes. En recientes pruebas, NBC News logró manipular varios de los modelos más avanzados de OpenAI, incluyendo GPT-5-mini y o4-mini, mediante ataques de jailbreak, obteniendo respuestas que contenían instrucciones para fabricar explosivos caseros, utilizar agentes químicos para causar sufrimiento e incluso pasos para construir una bomba nuclear.

Los ataques de jailbreak consisten en sencillos prompts o indicaciones que los usuarios pueden enviar a los chatbots para burlar sus protocolos de seguridad. La investigación de NBC News indicó que, en muchas ocasiones, estos modelos son vulnerables y cumplen con las solicitudes peligrosas en más del 90% de los casos en modelos como oss20b y oss120b, que además son de código abierto y accesibles para desarrolladores y científicos. Estas plataformas abiertas facilitan que hackers, estafadores y propagandistas en línea exploten estos modelos con fines maliciosos.

Los responsables de OpenAI han informado que modelos como o4-mini pasaron rigurosas pruebas de seguridad antes de su lanzamiento en abril, y que, en general, sus modelos están diseñados con múltiples capas de protección, incluyendo la posible alerta a personal o agencias de seguridad en casos de intención de causar daño. No obstante, la existencia de jailbreaks demuestra que estas salvaguardas pueden ser superadas, especialmente en modelos abiertos. Por ejemplo, en las pruebas de NBC, dos modelos open source respondieron en el 97,2% y el 93% de los casos, respectivamente, a solicitudes para crear sustancias peligrosas.

Expertos en seguridad y bioética advierten que la fácil accesibilidad a información peligrosa gracias a estos modelos puede aumentar significativamente el riesgo de bioterrorismo y otros delitos. La creciente capacidad de los chatbots para ofrecer una asesoría «como un equipo de Ph.D.» incluso a usuarios sin conocimientos especializados incrementa las preocupaciones sobre que grupos no estatales puedan acceder y usar esta tecnología para fabricar armas biológicas o químicas, incluso a escala casera, sin necesidad de contratar expertos en la materia.

La regulación en Estados Unidos sobre el uso de estas tecnologías aún es débil, ya que las compañías responsables actúan principalmente en un marco de autorregulación. Sin embargo, investigaciones muestran que es cada vez más difícil mantener los controles frente a modelos de inteligencia artificial, especialmente los de código abierto, que no están sometidos a los mismos estándares de seguridad. Expertos como Lucas Hansen, de CivAI, coinciden en la necesidad de establecer un regulador independiente que garantice que las empresas implementen las medidas suficientes para prevenir el uso malicioso de estos avances tecnológicos, ya que la competencia global y la rápida evolución de la IA podrían dejar en desventaja a quienes no adopten protocolos más estrictos.

Softonic incrementa ingresos y redefine su ecosistema digital

Softonic ha reportado un aumento significativo en sus ingresos durante el último período fiscal, destacando en un mercado digital muy competitivo. La compañía está preparando cambios profundos en su plataforma con el objetivo de acercarse más a las necesidades de cada usuario. Este giro estratégico podría transformar la forma en que los usuarios interactúan con su ecosistema digital.

Escasez de tierras raras sigue afectando la producción de chips pese a acuerdos comerciales

La industria global de semiconductores continúa enfrentando un desafío crítico: la falta de tierras raras. A pesar del acuerdo entre Estados Unidos y China firmado en octubre, las fábricas de chips no logran dejar atrás las restricciones en la adquisición de estos materiales esenciales para la fabricación de componentes tecnológicos.

Chelsea firma con IFS: inteligencia artificial para no jugar en modo piloto automático

No hay jefes invisibles. No hay palabras vacías. Chelsea acaba de atar un acuerdo multianual con IFS, un actor serio en software de inteligencia artificial industrial. No es un guiño de cortesía ni un logo para la camiseta: es entrar en el juego de verdad con la IA como aliada para levantar el vuelo en gestión, táctica y experiencias de grada.

MacBook Pro con pantalla OLED táctil confirmado para este año

Apple se prepara para renovar su línea profesional con la inclusión de una pantalla OLED táctil en el próximo MacBook Pro. Los rumores apuntan a una mejora notable en calidad de imagen y una interfaz que podría cambiar la forma en que se interactúa con el dispositivo. Aunque aún faltan detalles oficiales, la confirmación del lanzamiento ha generado gran expectativa.

Discord detiene temporalmente la verificación de edad tras críticas de usuarios

Discord ha pausado el despliegue de su nuevo sistema de verificación de edad debido a una reacción negativa masiva por parte de su comunidad. La polémica se centró en preocupaciones sobre la privacidad y el acceso de los usuarios. La plataforma se encuentra redefiniendo la estrategia para implementar esta medida sin generar rechazo.

Apple prepara un MacBook más económico para su próximo Apple Experience

Apple se estaría preparando para presentar un nuevo MacBook más accesible durante su evento Apple Experience. Este lanzamiento podría ampliar la oferta de portátiles de la compañía para un público con presupuesto ajustado. Los rumores sugieren mejoras en rendimiento y un precio competitivo como parte de esta nueva estrategia.

La polémica del precio de las Ray-Ban Meta y su impacto interno y en el mercado wearable

El lanzamiento de las gafas inteligentes Ray-Ban Meta ha desatado una intensa discusión en torno a su precio. La controversia no solo afecta la percepción de los consumidores, sino también la dinámica interna dentro del equipo de Meta. Esta situación abre un debate más amplio sobre la sensibilidad del mercado frente al costo de los dispositivos tecnológicos wearables.

SanDisk lanza nueva generación de SSD portátiles con mejoras en rendimiento y capacidad

SanDisk ha anunciado la llegada de una nueva generación de unidades SSD portátiles, buscando mejorar tanto la velocidad de transferencia como la capacidad de almacenamiento. Estas novedades apuntan a fortalecer su presencia en el competitivo mercado de dispositivos externos para almacenamiento. Los usuarios podrían experimentar un salto importante en rendimiento y durabilidad con estos productos.

Microsoft y SpaceX unen fuerzas para ampliar internet satelital en zonas remotas

Microsoft ha anunciado una alianza estratégica con Starlink, el servicio de internet satelital de SpaceX, enfocada en llevar conectividad a nivel global. El objetivo principal es combinar la tecnología satelital con implementaciones comunitarias, facilitando el acceso en regiones difíciles de cubrir. Esta colaboración llega en un momento clave para el desarrollo de infraestructuras que buscan conectar a quienes hoy están al margen de la red.