ChatGPT bajo la lupa: OpenAI reconoce riesgos de ciberataques en su navegador con Inteligencia Artificial

Compartir:

La compañía admitió que las herramientas con agentes autónomos amplían la superficie de exposición digital y que ciertas técnicas de manipulación externa no pueden erradicarse por completo, aun con refuerzos de seguridad.

  • OpenAI lanza una tienda de aplicaciones para ChatGPT: cómo funciona la nueva herramienta

  • OpenAI lanzó «Tu año con ChatGPT»: cómo ver el resumen anual de la IA

La firma tecnológica trabaja con simulaciones internas y controles preventivos para reducir el impacto de ataques que aprovechan mensajes ocultos en correos y sitios web.

OpenAI

OpenAI admitió este martes que su navegador con agentes de inteligencia artificial, integrado en ChatGPT Atlas, no puede estar totalmente a salvo de ciberataques, en particular de las llamadas inyecciones de instrucciones, una técnica que permite alterar el comportamiento de los sistemas mediante mensajes ocultos en correos o páginas web.

La compañía señaló que, pese a haber reforzado sus defensas, este tipo de ataques representa un problema estructural de la IA generativa y difícilmente pueda eliminarse por completo. Según OpenAI, el llamado “modo agente” amplía la superficie de riesgo, ya que combina autonomía operativa con acceso a información sensible.

Esa evaluación es compartida por organismos externos. El Centro Nacional de Ciberseguridad del Reino Unido advirtió que estas vulnerabilidades probablemente nunca puedan erradicarse del todo y recomendó concentrar los esfuerzos en reducir el impacto, más que en prometer una protección absoluta.

Defensas activas y riesgos persistentes

Como respuesta, OpenAI explicó que aplica un esquema de defensa dinámica basado en simulaciones internas de ataques. Para ello utiliza un sistema automatizado entrenado para actuar como atacante, que pone a prueba al navegador en entornos controlados y permite detectar fallas antes de que se exploten en situaciones reales.

La empresa reconoció, sin embargo, que no cuenta aún con métricas públicas que demuestren una baja sostenida en ataques exitosos, aunque afirmó que trabaja junto a equipos externos de seguridad desde antes del lanzamiento de Atlas.

Especialistas en ciberseguridad advirtieron que el riesgo en este tipo de herramientas crece cuando se combinan alto nivel de acceso con capacidad de acción autónoma. Por ese motivo, recomiendan limitar permisos, evitar accesos amplios a correos o cuentas sensibles y exigir confirmaciones humanas para operaciones críticas.

Desde OpenAI coincidieron en esa línea y aconsejaron configurar a los agentes con instrucciones específicas, controles previos y validaciones obligatorias, para reducir la posibilidad de manipulación mediante contenidos maliciosos ocultos.

También puede interesarte

Graciela Alfano reveló que Mauricio Macri la contactó tras separarse de Juliana Awada: Me escribió a las 4 de la mañana

Tras la confirmación de la separación entre Juliana Awada y Mauricio Macri, después de 15 años...

Causa Magis TV: audiencia clave para uno de los revendedores acusados de piratería digital

Las consecuencias legales por infringir la Ley 11.723 de Propiedad Intelectual pueden alcanzar tanto a quienes...

El Gobierno celebró el dato de inflación de 2025: «Es la más baja en ocho años, un logro extraordinario»

El Gobierno celebró este martes el último dato de inflación de 2025 que, si bien arrojó...

Corrupción en la AFA: Lilita Carrió reveló que aconsejó a Matías Yofe tirar su celular porque temía que le robaron pruebas sobre Pablo Toviggino

La líder de la Coalición Cívica Elisa reveló este martes que fue ella, en el carácter de consejera...