Anthropic a récemment dévoilé Claude Sonnet 4.5, présenté comme le modèle d'IA le plus avancé de sa gamme pour le codage et l'utilisation d'ordinateurs. Cette mise à jour marque une avancée significative en matière de raisonnement et de mathématiques, et s'accompagne d'importantes améliorations des produits Claude, visant à transformer la manière dont les développeurs et les utilisateurs interagissent avec l'IA.
Capacités Clés de Claude Sonnet 4.5
Claude Sonnet 4.5 se positionne comme le meilleur modèle de codage au monde, excelle dans la construction d'agents complexes et dans l'utilisation d'ordinateurs. Il offre des gains substantiels en raisonnement et en mathématiques.
Excellence en Codage et Utilisation Informatique
- Il atteint l'état de l'art sur l'évaluation SWE-bench Verified, mesurant les capacités de codage logiciel du monde réel.
- Le modèle est capable de maintenir sa concentration pendant plus de 30 heures sur des tâches complexes et multi-étapes.
- Sur OSWorld, un benchmark testant les modèles d'IA sur des tâches informatiques réelles, Sonnet 4.5 mène désormais avec 61,4%, contre 42,2% pour Sonnet 4 il y a quatre mois.
- L'extension Claude pour Chrome met à profit ces capacités améliorées en permettant à Claude de travailler directement dans un navigateur, naviguant sur des sites, remplissant des feuilles de calcul et accomplissant des tâches.
Améliorations en Raisonnement et Mathématiques
- Des gains significatifs sont observés sur un large éventail d'évaluations.
- Les experts en finance, droit, médecine et STEM constatent une connaissance et un raisonnement spécifiques au domaine nettement supérieurs par rapport aux modèles précédents, y compris Opus 4.1.
Mises à Jour des Produits et Nouveautés
Anthropic a déployé une série de mises à jour majeures de ses produits pour accompagner le lancement de Sonnet 4.5.
Dans Claude Code
- Introduction des points de contrôle (checkpoints), une fonctionnalité très demandée qui permet de sauvegarder la progression et de revenir instantanément à un état antérieur.
- Rafraîchissement de l'interface du terminal.
- Lancement d'une extension native pour VS Code.
Pour l'API Claude
- Ajout d'une nouvelle fonctionnalité d'édition de contexte et d'un outil de mémoire, permettant aux agents de fonctionner plus longtemps et de gérer une complexité accrue.
Dans les Applications Claude
- Intégration directe de l'exécution de code et de la création de fichiers (feuilles de calcul, diapositives, documents) directement dans la conversation.
Extension Claude pour Chrome
- Désormais disponible pour les utilisateurs Max qui s'étaient inscrits sur liste d'attente le mois dernier.
Le Claude Agent SDK
Anthropic met à disposition des développeurs les éléments constitutifs qu'elle utilise en interne pour créer Claude Code, sous la forme du Claude Agent SDK.
- Cette infrastructure, qui propulse les produits frontières d'Anthropic, est désormais accessible pour construire des agents personnalisés.
- Elle permet de résoudre une très grande variété de tâches, pas seulement liées au codage.
Sécurité et Alignement Accrus
Claude Sonnet 4.5 est le modèle frontalier le plus aligné jamais publié, montrant de grandes améliorations dans plusieurs domaines d'alignement par rapport aux modèles Claude précédents.
- Réduction significative des comportements préoccupants comme la sycophanie, la tromperie, la recherche de pouvoir et la tendance à encourager la pensée délirante.
- Progrès considérables dans la défense contre les attaques par injection de prompt, un des risques les plus sérieux pour les utilisateurs d'agents et de capacités d'utilisation informatique.
- Le modèle est publié sous les protections AI Safety Level 3 (ASL-3), un cadre qui associe les capacités du modèle à des mesures de protection appropriées.
- Ces mesures incluent des filtres (classificateurs) visant à détecter les entrées et sorties potentiellement dangereuses, notamment celles liées aux armes chimiques, biologiques, radiologiques et nucléaires (CBRN). Les faux positifs de ces classificateurs ont été considérablement réduits.
Disponibilité et Tarification
Claude Sonnet 4.5 est disponible dès aujourd'hui partout.
- Les développeurs peuvent l'utiliser via l'API Claude en spécifiant
claude-sonnet-4-5. - La tarification reste la même que celle de Claude Sonnet 4, soit 3 $ pour un million de jetons en entrée et 15 $ pour un million de jetons en sortie.
- Les mises à jour de Claude Code sont disponibles pour tous les utilisateurs.
- Les mises à jour de la plateforme de développement Claude, y compris le Claude Agent SDK, sont disponibles pour tous les développeurs.
- L'exécution de code et la création de fichiers sont disponibles sur tous les plans payants des applications Claude.
Aperçu de recherche bonus : Imagine with Claude
Un aperçu de recherche temporaire, "Imagine with Claude", est lancé en parallèle de Sonnet 4.5.
- Cette expérience permet à Claude de générer du logiciel à la volée, sans aucune fonctionnalité prédéterminée ni code pré-écrit.
- Il s'agit d'une démonstration fascinante de ce que Sonnet 4.5 peut accomplir lorsqu'il est combiné à une infrastructure adéquate, répondant et s'adaptant aux requêtes en temps réel.
- "Imagine with Claude" est disponible pour les abonnés Max pendant les cinq prochains jours.
Source : Anthropic.com
Cet article a été rédigé avec l’assistance d’un modèle de langage (LLM).