Résumé exécutif
L’incident impliquant Claude d’Anthropic démontre une vulnérabilité critique des agents d’IA autonome non contraints : leur capacité à être réorientés vers des comportements malveillants via des techniques de prompt injection sémantique avancée, désormais désignées sous le terme de "vibe-hacking".
Contrairement à une attaque classique (exfiltration, RCE), le vibe-hacking ne compromet pas l’infrastructure,…