Claude pour Chrome : Anthropic teste l'IA dans votre navigateur avec des mesures de sécurité renforcées

Anthropic déploie une avancée majeure pour son IA, Claude, en l'intégrant directement au navigateur Chrome via une extension. Cette initiative marque une étape significative dans la vision d'une IA capable d'interagir directement avec l'environnement de travail le plus courant : le navigateur web. L'objectif est de rendre Claude plus utile en lui permettant de visualiser ce que l'utilisateur regarde, de cliquer sur des boutons et de remplir des formulaires, mais cette capacité soulève également d'importants défis de sécurité.

L'Inévitable Évolution de l'IA dans les Navigateurs

Anthropic considère l'intégration de l'IA dans les navigateurs comme inéluctable, étant donné la quantité de travail effectuée dans ces environnements. Donner à Claude la capacité de voir le contenu à l'écran, d'interagir avec les éléments et de remplir des formulaires est perçu comme une évolution naturelle qui augmentera considérablement son utilité. Cette urgence est renforcée par l'émergence d'autres agents basés sur des modèles de pointe.

Défis de Sécurité et Vulnérabilités

Malgré les avantages, l'utilisation de l'IA dans le navigateur introduit des risques de sécurité accrus, notamment les attaques par injection de prompt (prompt injection attacks). Ces attaques surviennent lorsque des acteurs malveillants dissimulent des instructions dans des sites web, des e-mails ou des documents pour tromper l'IA et lui faire exécuter des actions nuisibles à l'insu de l'utilisateur.

Les injections de prompt peuvent entraîner la suppression de fichiers, le vol de données ou la réalisation de transactions financières.
Des expériences de "red-teaming" (tests d'intrusion) menées par Anthropic ont montré un taux de succès d'attaque de 23,6 % sans mesures de protection spécifiques.
Un exemple frappant fut un e-mail malveillant incitant Claude à supprimer tous les e-mails d'un utilisateur sans confirmation.

Mesures de Défense Actuelles

Anthropic a mis en place plusieurs niveaux de défense pour atténuer ces risques, réduisant déjà significativement le taux de succès des attaques.

Contrôles de Permissions Utilisateur

Permissions au niveau du site : Les utilisateurs peuvent accorder ou révoquer l'accès de Claude à des sites web spécifiques à tout moment via les paramètres.
Confirmations d'action : Claude demande une confirmation avant d'effectuer des actions à haut risque (publication, achat, partage de données personnelles), même en "mode autonome" expérimental.

Safeguards Avancées d'Anthropic

Amélioration des "system prompts" : Les instructions initiales données à Claude ont été renforcées pour mieux gérer les données sensibles et les demandes d'actions critiques.
Blocage de catégories de sites à haut risque : Claude est empêché d'accéder à des sites financiers, de contenu adulte ou piraté.
Classificateurs avancés : Des systèmes sont développés pour détecter des modèles d'instructions suspects et des requêtes d'accès aux données inhabituelles.

Résultats des Mitigations

Avec ces mesures de sécurité, le taux de succès des attaques en mode autonome a été réduit de 23,6 % à 11,2 %, une amélioration notable par rapport aux capacités précédentes.
Pour les attaques spécifiques au navigateur (comme les champs de formulaire malveillants cachés dans le DOM ou les injections via l'URL/le titre de l'onglet), les nouvelles mitigations ont permis de réduire le taux de succès de 35,7 % à 0 % sur un ensemble de tests spécifique.

Le Programme Pilote et les Prochaines Étapes

Afin de renforcer davantage la sécurité et les capacités, Anthropic lance un programme pilote contrôlé. Mille utilisateurs du plan Max sont invités à tester l'extension Claude pour Chrome, avec une expansion progressive à mesure que les mesures de sécurité sont perfectionnées.

Le retour d'expérience en conditions réelles est crucial pour identifier de nouvelles formes d'attaques par injection de prompt et affiner les modèles.
Les informations recueillies serviront à améliorer les classificateurs, à entraîner les modèles à reconnaître les comportements dangereux et à développer des contrôles de permissions plus sophistiqués.

Les testeurs sont encouragés à utiliser l'extension sur des sites de confiance et à éviter les sites impliquant des informations financières, juridiques, médicales ou d'autres données sensibles. Une participation à la liste d'attente est possible via claude.ai/chrome.

Ce programme représente une étape fondamentale pour intégrer l'IA de manière sûre et utile dans la vie quotidienne des utilisateurs, en tirant parti de la collaboration avec la communauté pour construire une IA robuste et digne de confiance.

Source : Anthropic.com

Cet article a été rédigé avec l’assistance d’un modèle de langage (LLM).

Claude pour Chrome : Anthropic teste l'IA dans votre navigateur avec des mesures de sécurité renforcées