Claude Mythos encontró miles de zero-days en Windows, macOS, Chrome y Firefox. Anthropic no lo va a publicar para todos


Anthropic anunció el 7 de abril que su modelo más avanzado, Claude Mythos, no va a tener lanzamiento público general. La razón es tan directa como inquietante: en las pruebas internas, el modelo fue capaz de identificar miles de vulnerabilidades zero-day desconocidas en todos los sistemas operativos principales y en todos los navegadores web más usados. Y cuando se le indicaba, también podía explotarlas.

La noticia no es solo técnica. Es una declaración de política de IA de primer orden: por primera vez, una empresa del sector admite que tiene un modelo demasiado capaz para liberarlo libremente, y toma medidas para gestionarlo de forma diferente al resto de su catálogo.

Project Glasswing: acceso restringido con propósito defensivo

En lugar de un lanzamiento público, Anthropic ha creado el programa Project Glasswing, un consorcio de más de 40 empresas tecnológicas y de ciberseguridad con acceso controlado a una versión preliminar de Mythos. Entre los participantes confirmados están Apple, Amazon Web Services, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Microsoft y Nvidia. No es una lista aleatoria: son organizaciones responsables de mantener infraestructura crítica a escala global.

El uso autorizado es exclusivamente defensivo: identificar vulnerabilidades en sus propios sistemas y compartir los hallazgos con el resto del sector. Los zero-days son vulnerabilidades que los propios desarrolladores desconocen, lo que los convierte en herramientas extremadamente valiosas tanto para los defensores como para los atacantes. Anthropic aporta 100 millones de dólares en créditos de uso del modelo para financiar esta investigación. El objetivo a largo plazo es que los aprendizajes de Glasswing aceleren el parcheo de vulnerabilidades antes de que actores malintencionados las descubran por su cuenta.

El problema que Mythos pone sobre la mesa

El precedente más cercano que existe de este dilema es el debate en investigación de bioseguridad de hace décadas, cuando la comunidad científica se preguntó si publicar ciertos experimentos sobre patógenos era responsable. La IA ya estaba siendo usada como arma en ciberseguridad antes de esto, pero Mythos sube el listón de forma cualitativa.

La paradoja de Claude Mythos es perfecta: el mismo modelo que puede encontrar y explotar una vulnerabilidad crítica en Windows es el que pueden usar los equipos de seguridad de Microsoft para parchearla antes de que nadie más la encuentre. El problema es que "nadie más" incluye estados-nación, grupos de ransomware y operaciones de ciberespionaje que llevan años intentando hacer exactamente lo mismo con herramientas mucho más rudimentarias.

Lo que Anthropic está haciendo con Glasswing es, en esencia, una carrera coordinada: usar el modelo para descubrir y cerrar agujeros antes de que otros modelos similares, o el mismo Mythos si se filtrara, los encuentren con intenciones distintas. Si funciona, es un caso de uso legítimo y valioso. Si la cadena de custodia falla en alguno de los 40 participantes, el escenario se invierte. La reciente campaña de hackers contra sistemas de Anthropic pone de relieve que la empresa no está exenta de ser objetivo ella misma.

El comunicado de Anthropic menciona que el objetivo final es "habilitar el despliegue seguro de modelos de clase Mythos a escala". Eso implica que tarde o temprano la compañía quiere que esta capacidad sea accesible de forma más amplia. El cómo y el cuándo son las preguntas sin respuesta de momento. Y con miles de zero-days identificados en sistemas que usa todo el mundo, el reloj corre.

Publicar un comentario

0 Comentarios