ChatGPT bajo la lupa: OpenAI reconoce riesgos de ciberataques en su navegador con Inteligencia Artificial

Compartir:

La compañía admitió que las herramientas con agentes autónomos amplían la superficie de exposición digital y que ciertas técnicas de manipulación externa no pueden erradicarse por completo, aun con refuerzos de seguridad.

  • OpenAI lanza una tienda de aplicaciones para ChatGPT: cómo funciona la nueva herramienta

  • OpenAI lanzó «Tu año con ChatGPT»: cómo ver el resumen anual de la IA

La firma tecnológica trabaja con simulaciones internas y controles preventivos para reducir el impacto de ataques que aprovechan mensajes ocultos en correos y sitios web.

OpenAI

OpenAI admitió este martes que su navegador con agentes de inteligencia artificial, integrado en ChatGPT Atlas, no puede estar totalmente a salvo de ciberataques, en particular de las llamadas inyecciones de instrucciones, una técnica que permite alterar el comportamiento de los sistemas mediante mensajes ocultos en correos o páginas web.

La compañía señaló que, pese a haber reforzado sus defensas, este tipo de ataques representa un problema estructural de la IA generativa y difícilmente pueda eliminarse por completo. Según OpenAI, el llamado “modo agente” amplía la superficie de riesgo, ya que combina autonomía operativa con acceso a información sensible.

Esa evaluación es compartida por organismos externos. El Centro Nacional de Ciberseguridad del Reino Unido advirtió que estas vulnerabilidades probablemente nunca puedan erradicarse del todo y recomendó concentrar los esfuerzos en reducir el impacto, más que en prometer una protección absoluta.

Defensas activas y riesgos persistentes

Como respuesta, OpenAI explicó que aplica un esquema de defensa dinámica basado en simulaciones internas de ataques. Para ello utiliza un sistema automatizado entrenado para actuar como atacante, que pone a prueba al navegador en entornos controlados y permite detectar fallas antes de que se exploten en situaciones reales.

La empresa reconoció, sin embargo, que no cuenta aún con métricas públicas que demuestren una baja sostenida en ataques exitosos, aunque afirmó que trabaja junto a equipos externos de seguridad desde antes del lanzamiento de Atlas.

Especialistas en ciberseguridad advirtieron que el riesgo en este tipo de herramientas crece cuando se combinan alto nivel de acceso con capacidad de acción autónoma. Por ese motivo, recomiendan limitar permisos, evitar accesos amplios a correos o cuentas sensibles y exigir confirmaciones humanas para operaciones críticas.

Desde OpenAI coincidieron en esa línea y aconsejaron configurar a los agentes con instrucciones específicas, controles previos y validaciones obligatorias, para reducir la posibilidad de manipulación mediante contenidos maliciosos ocultos.

También puede interesarte

Mercedes se retira de la negociación para comprar acciones de Alpine F1

Mercedes abandonó las conversaciones con Otro Capital para comprar el 24% de Alpine F1 tras diferencias económicas. Steve Cohen queda como principal oferente.

Selección Argentina enfrentará temperaturas extremas en la fase de grupos del Mundial 2026

La Selección Argentina jugará la fase de grupos del Mundial 2026 en Estados Unidos bajo una ola de calor que afecta el sur y centro del país, con temperaturas superiores a 38°C.

Hallan sin vida a una adolescente de 14 años en Córdoba: investigan un crimen sexual

Una niña de 14 años fue hallada sin vida en Córdoba. La investigación se centra en un presunto abuso sexual seguido de homicidio. Un hombre de 26 años fue detenido como principal sospechoso.

Chile: incidentes entre carabineros y manifestantes en marcha contra recortes presupuestarios

Efectivos de Carabineros reprimieron a manifestantes en una marcha convocada por estudiantes y docentes en Chile contra recortes en salud y educación.