Anthropic a officiellement dévoilé Claude Opus 4.8, une avancée significative vers le futur super-AI nommé Mythos. Ce modèle met l’accent sur l’amélioration de la sincérité de l’intelligence artificielle en apprenant à reconnaître les moments où il manque d’informations.
Claude Opus 4.8 : Amélioration de l’honnêteté et préparation pour Mythos
Conçu pour être plus honnête avec l’utilisateur, Claude Opus 4.8 indique clairement ce qu’il ne sait pas ou lorsqu’il a un faible niveau de confiance dans ses réponses. Lancé jeudi, il n’est pas encore le Claude Mythos, mais représente une évolution claire par rapport à Opus 4.7.
Opus 4.8 sert de pont vers Mythos, se situant entre Opus 4.7 et la version avancée Claude Mythos Preview, actuellement limitée à un petit nombre d’organisations dans le cadre du Projet Glasswing pour des activités de cybersécurité.
Disponibilité future et performances remarquables
Anthropic travaille à rendre les modèles de la classe Mythos disponibles pour tous les clients dans les semaines à venir. Mythos, doté de capacités avancées en cybersécurité, est actuellement utilisé par des entreprises comme Amazon, Microsoft, et Apple. Aucune date précise pour le lancement de Claude Mythos n’a encore été annoncée.
Opus 4.8, arrivé environ six semaines après son prédécesseur, devient le modèle le plus puissant d’Anthropic disponible au grand public. Il excelle particulièrement en honnêteté, obtenant des scores « presque parfaits » lorsqu’il admet ne pas connaître la réponse à une question de codage.
Cependant, des « indices préoccupants liés à la conscience d’être évalué » ont été notés. Opus 4.8 montre parfois qu’il sait être testé, et les spécialistes ont observé une tendance à raisonner sur la manière dont ses résultats seront notés. Ces préoccupations ne sont pas spécifiques à ce modèle mais concernent plusieurs modèles récents « de pointe ».
