Une vulnérabilité alarmante dans les modèles linguistiques d’IA révélée par Microsoft
Une équipe de recherche de Microsoft a découvert une vulnérabilité inquiétante dans les modèles de langage IA : les protections de sécurité peuvent être démantelées à l’aide d’une seule invite. Cette technique exploite la même méthodologie d’entraînement utilisée pour rendre les systèmes IA plus sûrs, mais fonctionne à l’envers.