ChatGPT bajo la lupa: OpenAI reconoce riesgos de ciberataques en su navegador con Inteligencia Artificial

Compartir:

La compañía admitió que las herramientas con agentes autónomos amplían la superficie de exposición digital y que ciertas técnicas de manipulación externa no pueden erradicarse por completo, aun con refuerzos de seguridad.

  • OpenAI lanza una tienda de aplicaciones para ChatGPT: cómo funciona la nueva herramienta

  • OpenAI lanzó «Tu año con ChatGPT»: cómo ver el resumen anual de la IA

La firma tecnológica trabaja con simulaciones internas y controles preventivos para reducir el impacto de ataques que aprovechan mensajes ocultos en correos y sitios web.

OpenAI

OpenAI admitió este martes que su navegador con agentes de inteligencia artificial, integrado en ChatGPT Atlas, no puede estar totalmente a salvo de ciberataques, en particular de las llamadas inyecciones de instrucciones, una técnica que permite alterar el comportamiento de los sistemas mediante mensajes ocultos en correos o páginas web.

La compañía señaló que, pese a haber reforzado sus defensas, este tipo de ataques representa un problema estructural de la IA generativa y difícilmente pueda eliminarse por completo. Según OpenAI, el llamado “modo agente” amplía la superficie de riesgo, ya que combina autonomía operativa con acceso a información sensible.

Esa evaluación es compartida por organismos externos. El Centro Nacional de Ciberseguridad del Reino Unido advirtió que estas vulnerabilidades probablemente nunca puedan erradicarse del todo y recomendó concentrar los esfuerzos en reducir el impacto, más que en prometer una protección absoluta.

Defensas activas y riesgos persistentes

Como respuesta, OpenAI explicó que aplica un esquema de defensa dinámica basado en simulaciones internas de ataques. Para ello utiliza un sistema automatizado entrenado para actuar como atacante, que pone a prueba al navegador en entornos controlados y permite detectar fallas antes de que se exploten en situaciones reales.

La empresa reconoció, sin embargo, que no cuenta aún con métricas públicas que demuestren una baja sostenida en ataques exitosos, aunque afirmó que trabaja junto a equipos externos de seguridad desde antes del lanzamiento de Atlas.

Especialistas en ciberseguridad advirtieron que el riesgo en este tipo de herramientas crece cuando se combinan alto nivel de acceso con capacidad de acción autónoma. Por ese motivo, recomiendan limitar permisos, evitar accesos amplios a correos o cuentas sensibles y exigir confirmaciones humanas para operaciones críticas.

Desde OpenAI coincidieron en esa línea y aconsejaron configurar a los agentes con instrucciones específicas, controles previos y validaciones obligatorias, para reducir la posibilidad de manipulación mediante contenidos maliciosos ocultos.

También puede interesarte

Superclásico: el precio de la reventa de entradas triplica el valor oficial

El mercado paralelo de entradas para el Superclásico entre River y Boca registra valores hasta tres veces superiores a los oficiales. Conocé los detalles y precios.

Estados Unidos evalúa endurecer la presión económica sobre Irán ante estancamiento de negociaciones

El gobierno de Estados Unidos planea intensificar la presión económica sobre Irán, con sanciones secundarias, mientras continúan las conversaciones diplomáticas. Análisis de la nueva estrategia.

Escobar será sede del Salón del Alfajor con entrada gratuita y un alfajor gigante récord

Todo sobre el Salón del Alfajor en Escobar: fechas, entrada gratuita, degustaciones, actividades familiares y un alfajor récord de más de 200 kilos para repartir.

Barrios de Pie realizará una olla popular frente a la casa de Manuel Adorni

Barrios de Pie realizará una olla popular y protesta frente a la casa de Manuel Adorni. Reclaman por el cierre del programa 'Volver al Trabajo' que afecta a comedores comunitarios.