Anthropic presentó Opus 4.5, la versión más reciente de su modelo insignia dentro de la serie 4.5, que también incluye a Sonnet y Haiku. La empresa anunció que el nuevo modelo ofrece un rendimiento de última generación en pruebas de codificación, uso de herramientas y resolución de problemas complejos, situándose entre las mejores opciones del mercado.
Opus 4.5 destacó especialmente en puntos de referencia como SWE-Bench verificado, donde logró una puntuación superior al 80%, la más alta alcanzada hasta ahora por un modelo de inteligencia artificial. También mostró avances en herramientas como tau2-bench, MCP Atlas y en pruebas generales como ARC-AGI 2 y GPQA Diamond.
Junto a la actualización del modelo, Anthropic anunció la ampliación de sus herramientas asociadas. La extensión Claude para Chrome, que estaba en fase piloto, estará disponible para todos los usuarios de Max. Por su parte, Claude para Excel se abrirá a usuarios Max, Team y Enterprise, permitiendo automatizar análisis y funciones complejas dentro de hojas de cálculo.
La compañía también introdujo mejoras importantes en la administración de memoria, esenciales para tareas de contexto largo. Según Dianne Na Penn, jefa de gestión de productos de investigación, el modelo fue entrenado para recordar detalles relevantes sin depender únicamente del tamaño de ventana de contexto, lo que mejora el rendimiento en exploración de grandes bases de código y documentos extensos.
Estas mejoras habilitan la función de “chat sin fin”, muy demandada por los usuarios. Esta novedad permite mantener conversaciones continuas sin reinicios visibles: el modelo comprime su memoria automáticamente cuando alcanza el límite, evitando interrupciones.
Opus 4.5 también fue diseñado pensando en el trabajo con agentes, especialmente en escenarios donde actúa como agente principal coordinando subagentes basados en Haiku. La memoria mejorada facilita la gestión de tareas largas y complejas, como analizar código, revisar documentos o retroceder para comprobar pasos previos.
El lanzamiento llega en un contexto de fuerte competencia en el sector. Opus 4.5 se enfrentará a modelos de frontera presentados recientemente, como GPT-5.1 de OpenAI y Gemini-3 de Google, que también destacan en rendimiento avanzado y capacidades multitarea.
Para Anthropic, la apuesta por integraciones prácticas y mejoras orientadas a agentes representa un paso clave para consolidar su posición en el mercado de inteligencia artificial, cada vez más dominado por modelos capaces de trabajar con contexto extenso y herramientas profesionales.