Radio viva Fenix | OpenAI blinda ChatGPT Atlas y refuerza su seguridad frente a ataques avanzados

OpenAI blinda ChatGPT Atlas y refuerza su seguridad frente a ataques avanzados

26 de Diciembre de 2025

La compañía anunció nuevas medidas para proteger el modo agente del navegador con IA y reducir riesgos asociados a la inyección de prompts

OpenAI dio a conocer nuevas acciones para fortalecer la seguridad de ChatGPT Atlas, su navegador web impulsado por inteligencia artificial, una herramienta que aún se encuentra en desarrollo pero que ya plantea retos importantes en materia de ciberseguridad. La compañía busca cerrar brechas críticas antes de que el producto alcance una adopción masiva.

Uno de los principales focos de atención es el modo agente, una función que permite a la IA navegar por internet y ejecutar tareas de forma autónoma. Precisamente esta capacidad, considerada uno de los mayores atractivos del sistema, también se ha convertido en su mayor punto de vulnerabilidad frente a ataques maliciosos.

La amenaza más relevante identificada por OpenAI es la llamada inyección de prompts, una técnica que consiste en ocultar instrucciones maliciosas dentro de textos, correos o páginas web para engañar a la inteligencia artificial y llevarla a ejecutar acciones no deseadas, muchas veces sin que el usuario lo note.

Aunque este tipo de ataque no es nuevo en el ecosistema de la IA generativa, su adaptación a navegadores con funciones autónomas ha elevado el nivel de riesgo. En el caso de ChatGPT Atlas, la capacidad de actuar sin intervención constante del usuario abre la puerta a fraudes, accesos indebidos o envío de información sensible.

Para enfrentar este problema, OpenAI desarrolló un sistema interno al que denomina un “atacante automatizado basado en modelos de lenguaje”. Se trata de un bot entrenado mediante aprendizaje por refuerzo, diseñado para crear, probar y perfeccionar ataques simulados contra el modo agente, con el fin de identificar fallas antes de que puedan ser explotadas en escenarios reales.

Según la compañía, este enfoque permite anticiparse a los ciberdelincuentes, ya que el sistema aprende de cada intento fallido y ajusta sus estrategias, ayudando a fortalecer las defensas del navegador. Un ejemplo presentado por OpenAI muestra cómo, tras la actualización, ChatGPT Atlas logra detectar instrucciones maliciosas ocultas en un correo electrónico y alerta al usuario en lugar de ejecutar la acción.

Desde OpenAI aclaran que estas medidas representan apenas un primer paso. Las técnicas de ataque continúan evolucionando y requieren mejoras constantes. Mientras tanto, la empresa recomienda a los usuarios emplear el modo agente con precaución, evitar iniciar sesión en sitios sensibles y revisar cuidadosamente las solicitudes de confirmación, como parte de una estrategia preventiva para reducir riesgos.

Foto: Hipertextual

NOTICIAS RELEVANTES

Voraz incendio estructural en el sur de Bogotá obligó al cierre de vías y generó congestión

19 de Junio de 2026

Un incendio estructural de grandes proporciones se registró en el barrio La Aurora, en la...

Seguir leyendo →

Ley seca en Bogotá comenzará desde la medianoche del viernes y se extenderá hasta el lunes

18 de Junio de 2026

La Alcaldía de Bogotá confirmó que la ley seca para la segunda vuelta presidencial comenzará a...

Seguir leyendo →

WhatsApp prepara una nueva función para enviar audios sin abrir la aplicación

18 de Junio de 2026

WhatsApp se encuentra desarrollando una nueva herramienta que podría transformar la manera en que...

Seguir leyendo →

VER TODAS LAS NOTICIAS