ChatGPT bajo la lupa: OpenAI reconoce riesgos de ciberataques en su navegador con Inteligencia Artificial

Compartir:

La compañía admitió que las herramientas con agentes autónomos amplían la superficie de exposición digital y que ciertas técnicas de manipulación externa no pueden erradicarse por completo, aun con refuerzos de seguridad.

  • OpenAI lanza una tienda de aplicaciones para ChatGPT: cómo funciona la nueva herramienta

  • OpenAI lanzó «Tu año con ChatGPT»: cómo ver el resumen anual de la IA

La firma tecnológica trabaja con simulaciones internas y controles preventivos para reducir el impacto de ataques que aprovechan mensajes ocultos en correos y sitios web.

OpenAI

OpenAI admitió este martes que su navegador con agentes de inteligencia artificial, integrado en ChatGPT Atlas, no puede estar totalmente a salvo de ciberataques, en particular de las llamadas inyecciones de instrucciones, una técnica que permite alterar el comportamiento de los sistemas mediante mensajes ocultos en correos o páginas web.

La compañía señaló que, pese a haber reforzado sus defensas, este tipo de ataques representa un problema estructural de la IA generativa y difícilmente pueda eliminarse por completo. Según OpenAI, el llamado “modo agente” amplía la superficie de riesgo, ya que combina autonomía operativa con acceso a información sensible.

Esa evaluación es compartida por organismos externos. El Centro Nacional de Ciberseguridad del Reino Unido advirtió que estas vulnerabilidades probablemente nunca puedan erradicarse del todo y recomendó concentrar los esfuerzos en reducir el impacto, más que en prometer una protección absoluta.

Defensas activas y riesgos persistentes

Como respuesta, OpenAI explicó que aplica un esquema de defensa dinámica basado en simulaciones internas de ataques. Para ello utiliza un sistema automatizado entrenado para actuar como atacante, que pone a prueba al navegador en entornos controlados y permite detectar fallas antes de que se exploten en situaciones reales.

La empresa reconoció, sin embargo, que no cuenta aún con métricas públicas que demuestren una baja sostenida en ataques exitosos, aunque afirmó que trabaja junto a equipos externos de seguridad desde antes del lanzamiento de Atlas.

Especialistas en ciberseguridad advirtieron que el riesgo en este tipo de herramientas crece cuando se combinan alto nivel de acceso con capacidad de acción autónoma. Por ese motivo, recomiendan limitar permisos, evitar accesos amplios a correos o cuentas sensibles y exigir confirmaciones humanas para operaciones críticas.

Desde OpenAI coincidieron en esa línea y aconsejaron configurar a los agentes con instrucciones específicas, controles previos y validaciones obligatorias, para reducir la posibilidad de manipulación mediante contenidos maliciosos ocultos.

También puede interesarte

Una vez más, los salarios volvieron a perder contra la inflación en noviembre

El INDEC, indic que el ltimo ndice de salarios determin que el poder adquisitivo contina teniendo...

Córdoba registra 965 deudores alimentarios, pero el incumplimiento real sería mucho mayor y alcanzaría hasta el 40% de los casos

En la provincia de Córdoba, el Registro de Deudores Alimentarios Morosos contabiliza 965 personas inscriptas y vigentes....

Bonos y peso de Colombia se desploman tras encuesta que da amplia ventaja a Iván Cepeda

Los bonos en dólares de Colombia caen a lo largo de la curva el jueves y el...

Estalla una guerra abierta entre Pakistán y los talibanes de Afganistán: bombardeos en Kabul

KABUL.– La disputa fronteriza entre Afganistán y Pakistán, dos países gobernados por regímenes islámicos sunnitas, escaló este jueves...