Anthropic acaba de anunciar el último modelo de inteligencia artificial llamado Claude Opus 4.8. Según la compañía, esta es una versión significativamente mejorada en la capacidad de colaborar con los usuarios, especialmente en campos como la programación automatizada, el razonamiento multidisciplinario, el control de computadoras con agentes de IA, el procesamiento de tareas de conocimiento y el análisis financiero.
Los equipos de prueba evaluaron que el Opus 4.8 es más confiable y tiene la capacidad de hacer juicios más agudos al realizar tareas automáticas. El modelo también ha mejorado la fidelidad, advirtiendo regularmente cuando no están seguros de los resultados en lugar de hacer afirmaciones infundadas.
Según Anthropic, las reseñas internas muestran que Opus 4.8 tiene una capacidad significativamente mejor para detectar y reconocer errores en el código creado por él mismo. La tasa de omitir errores sin advertencias se ha reducido aproximadamente 4 veces en comparación con la versión anterior.
Las pruebas de seguridad y adecuación al usuario también registraron resultados positivos. Opus 4.8 obtuvo puntuaciones más altas en criterios como el respeto a la autonomía del usuario y las acciones en beneficio del usuario.
Anthropic también dijo que el modo de respuesta rápida del Opus 4.8 tiene una velocidad de procesamiento 2,5 veces más rápida que antes, mientras que los costos operativos se reducen aproximadamente 3 veces.