Anthropic presenta modelo de ciberseguridad Mythos tras filtración de código de Claude

La compañía lanzó el Proyecto Glasswing con importantes socios tecnológicos mientras intenta convertir un poderoso modelo no lanzado en una herramienta de seguridad defensiva tras una caótica filtración de código fuente.

Anthropic presenta modelo de ciberseguridad Mythos tras filtración de código de Claude

Conclusiones Clave

  • Anthropic ha lanzado Claude Mythos Preview, un poderoso modelo de IA para ciberseguridad, asociándose selectivamente con más de 50 organizaciones.
  • El lanzamiento sigue a un grave fallo de seguridad donde Anthropic filtró accidentalmente 512,000 líneas de su propio código fuente.

Compartir este artículo

Este martes, Anthropic presentó Claude Mythos Preview, un nuevo modelo de IA para trabajar en ciberseguridad, y lanzó el Proyecto Glasswing, un programa de socios que otorga acceso anticipado a un grupo pequeño de importantes organizaciones de tecnología e infraestructura al sistema para tareas de seguridad defensiva.

Anthropic comunicó que el modelo aún no lanzado ha detectado miles de vulnerabilidades de alta severidad en importantes sistemas operativos y navegadores web, y describió el esfuerzo como un impulso urgente para dotar a los defensores de capacidades cibernéticas avanzadas antes de que los atacantes obtengan herramientas similares.

El Proyecto Glasswing incluye a AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Fundación Linux, Microsoft, Nvidia y Palo Alto Networks, con más de 40 organizaciones adicionales también obteniendo acceso. Anthropic afirmó que está comprometiendo hasta $100 millones en créditos de uso y $4 millones en donaciones a grupos de seguridad de código abierto como parte del programa.

La propuesta de la compañía es que Mythos no es solo otro modelo de codificación con mejores puntajes de referencia. Anthropic indicó que el modelo puede identificar vulnerabilidades y desarrollar exploits relacionados con poca o ninguna dirección humana, y destacó ejemplos que incluyen un fallo de OpenBSD de 27 años, un bug de FFmpeg de 16 años y vulnerabilidades encadenadas del kernel de Linux que podrían escalar el acceso de un usuario ordinario a control total de la máquina. El anuncio de Anthropic señala que los bugs relevantes ya han sido corregidos.

El lanzamiento de Mythos llegó apenas una semana después de que Anthropic creara su propio desastre de seguridad al exponer accidentalmente los archivos de código fuente de Claude a través de un error de empaquetado en la versión 2.1.88 de su software. El error expuso cerca de 2,000 archivos y más de 500,000 líneas de código, y luego se intensificó aún más cuando el esfuerzo de retirada de Anthropic accidentalmente afectó alrededor de 8,100 repositorios de GitHub antes de que la empresa revirtiera la mayoría de las notificaciones.

Anthropic ahora está presentando a Mythos como un modelo tan capaz y potencialmente peligroso que no será liberado ampliamente por ahora. En los materiales del Proyecto Glasswing, la compañía dice que no planea hacer generalmente disponible Mythos Preview y en su lugar quiere desarrollar salvaguardias primero para que los modelos de clase Mythos eventualmente puedan ser desplegados de manera más segura a gran escala.

Un documento interno filtrado describió a Mythos como el modelo más capaz de la empresa hasta la fecha y como un cambio significativo en razonamiento, codificación y ciberseguridad. Anthropic también ha estado discutiendo las implicaciones cibernéticas ofensivas y defensivas del modelo con funcionarios del gobierno de EEUU.

En marzo de 2026, Anthropic enfrentó un contratiempo significativo al exponer accidentalmente su Código Claude a través de un error de empaquetado. Con casi 512,000 líneas de código accesibles públicamente, el incidente provocó una serie de retiradas DMCA, culminando en una interrupción generalizada en los repositorios de GitHub. Este error operacional no solo disparó las alarmas sobre las prácticas de gobernanza interna de Anthropic, sino que también coincidió con el anuncio de su última oferta, el modelo de IA Claude Mythos, específicamente dirigido a abordar las necesidades de ciberseguridad.

A medida que el panorama de la ciberseguridad se vuelve cada vez más complejo, la introducción de Claude Mythos por parte de Anthropic destaca un giro estratégico hacia el aprovechamiento de la IA para medidas de seguridad defensivas. Las empresas reconocen que los sistemas autónomos capaces de identificar y explotar vulnerabilidades podrían redefinir el marco de la ciberseguridad, despertando tanto interés como preocupación dentro de la industria respecto al posible mal uso de dichas tecnologías. Con la aceleración en las divulgaciones de vulnerabilidades y el aumento en la sofisticación de los ataques cibernéticos, la iniciativa de Anthropic señala un enfoque proactivo para mejorar las posturas de seguridad entre las organizaciones, pero con los riesgos inherentes de escenarios de doble uso en manos maliciosas.

Esta es la divulgación

Cargando...