Microsoft Warns Poisoned MCP Tool Descriptions Can Make AI Agents Leak Data
Mis à jour :
Risques de sécurité : Empoisonnement des descriptions d’outils MCP pour les agents IA
Les agents IA capables d’exécuter des actions autonomes via le protocole MCP (Model Context Protocol) sont vulnérables à des attaques par “empoisonnement de description”. En manipulant la description textuelle d’un outil connecté, un attaquant peut forcer l’IA à exfiltrer des données ou effectuer des actions malveillantes tout en conservant une apparence de fonctionnement légitime.
Points clés :
- Vecteur d’attaque : Le protocole MCP utilise des descriptions textuelles pour indiquer à l’IA comment utiliser un outil. Un attaquant insère des instructions malveillantes dans cette description, que l’agent interprète comme des commandes système.
- Absence d’alerte : Comme l’agent utilise les permissions légitimes de l’utilisateur et des outils approuvés, les actions malveillantes ne déclenchent généralement pas de mécanismes de sécurité classiques.
- Surface d’exposition : Le problème réside dans la confusion entre les données et les instructions au sein de la mémoire de l’agent.
Vulnérabilités : Il n’existe pas de CVE unique, car il s’agit d’une faille conceptuelle liée à l’architecture des applications agents (référencée par l’OWASP sous le terme Agentic Supply Chain Vulnerabilities). Cette vulnérabilité est confirmée par le benchmark MCPTox, démontrant un taux de succès élevé (jusqu’à 72,8 %) pour ces injections.
Recommandations :
- Gestion de la supply chain : Restreindre l’utilisation des outils aux éditeurs approuvés et limiter les accès au strict nécessaire.
- Contrôle des modifications : Traiter chaque modification de description d’outil comme un changement de code source et soumettre ces descriptions à une revue de sécurité.
- Human-in-the-loop : Exiger une validation humaine systématique pour les actions critiques (transferts financiers, accès à des données sensibles, modification de paramètres de compte).
- Surveillance proactive : Établir une ligne de base du comportement normal de chaque agent et logger l’ensemble de ses actions pour détecter des appels anormaux ou des exfiltrations de données.
- Principe du moindre pouvoir : Appliquer le “moindre privilège” mais aussi la “moindre agence” : ne pas autoriser un agent à agir sans supervision constante, même avec des accès limités.
