ChatGPT : une faille de sécurité insoluble plombe le futur des chatbots

Antoine Barsacq , le 11 septembre 2023

Que ce soit ChatGPT, Bing ou Bard, aucun chatbot n’échappe à cette faille de sécurité insoluble qui met en péril l’avenir de intelligence artificielle générative. Appelée “attaque par injection indirecte d’invite”, cette faille peut mettre n’importe quel utilisateur à la merci de pirates.

Il n’a pas fallu attendre longtemps avant que l’intelligence artificielle ne soit détournée par des acteurs mal-intentionnés. En janvier, des pirates russes se servaient déjà de ChatGPT pour mener leurs attaques. Depuis, les utilisation malfaisantes des intelligences artificielles génératives se sont multipliés et désormais, ChatGPT est capable de créer des malwares indétectables d’une redoutable dangerosité.

Contourner les mesure de sécurité mises en place par OpenAI, Google ou Microsoft n’est pas compliqué, comme l’ont montré des chercheurs en février. En effet, les chatbots comme Bing peuvent accéder aux pages web ouvertes par un utilisateur, si ce dernier l’y autorise. Un pirate peut exploiter cette faille pour dissimuler des instructions malfaisantes dans un site web visité.

Cela transforme l’IA en un formidable outil d’extraction d’informations personnelles. Dans le cas de leur expérience, les chercheurs avaient réussi à amener le chatbot à demander des informations bancaires sensibles aux utilisateurs. Ces derniers n’avaient commis aucune autre faute, mis à part d’interagir avec l’intelligence artificielle de Microsoft.

Les attaques par injection indirecte d’invite, un danger de l’IA

Les attaques par injection d’invites se divisent en deux catégories :

Les attaques directes, qui se produisent lorsqu’on essaie de faire répondre le grand modèle de langage (GML) d’une manière non voulue, par exemple en l’incitant à prononcer des discours racistes, comme GPT-4 le faisait lors des phases de test. Ce type d’attaque peut facilement être empêché.
Les attaques indirectes, comme dans l’exemple susmentionné, sont plus préoccupantes et vont encore plus loin. Au lieu que l’utilisateur saisisse lui-même une invite malveillante, l’instruction provient d’un tiers. Un site web que l’IA peut lire, ou un PDF analysé, peut contenir des instructions cachées que l’IA devrait suivre.

Dans les pages de Wired, Rich Harang, le responsable de la sécurité des systèmes d’IA de Nvidia, explique que ces attaques impliquent que la personne qui fournit les données d’apprentissage a une grande influence sur les résultats que recrache l’IA. L’intelligence artificielle est donc facilement manipulable et ses résultats peuvent vite s’avérer complètement bidons voire dangereux. Comme de plus en plus d’entreprises utilisent l’IA générative et que les employés partagent trop de secrets, le problème devient d’autant plus criant.

Comment faire pour utiliser ChatGPT en toute sécurité ?

Selon les informations de Wired, Google a lancé plusieurs projets pour comprendre comment l’IA réagit aux attaques par injection indirecte d’invite et trouver une solution. De son côté, OpenAI, l’entreprise conceptrice de ChatGPT, déclare rechercher activement une solution à cette faille. De même chez son partenaire, Microsoft, chez qui de grandes équipes travaillent sur les problèmes de sécurité.

Chez Google, les équipes utilisent l’IA pour résoudre ce problème. Le serpent se mord quasiment la queue : des modèles spécialement formés aident à identifier les prompts malveillants connus et les résultats dangereux qui violent les politiques de l’entreprise. De même, Nvidia a publié une série de garde-fous en open source à ajouter aux GML. Mais ces approches n’ont qu’une portée limitée, car il n’est pas possible d’identifier toutes les invites malveillantes.

Le National Cyber Security Center (NCSC), une branche du renseignement britannique, avertit également sur le risque d’attaques par injection. L’institution affirme que des centaines de tentatives d’attaque ont déjà rapportés. “Alors que des recherches sont en cours sur l’injection rapide, il peut s’agir d’un problème inhérent à la technologie GML“, avertit l’agence dans un billet de blog “Certaines stratégies peuvent rendre l’injection rapide plus difficile, mais il n’existe pas encore de solutions infaillibles.”

Ainsi, il n’existe pas à l’heure actuelle solution miracle, mais certaines bonnes pratiques de sécurité peuvent réduire les risques. Il faut avant tout traiter les chatbots de la même manière qu’il faut traiter un inconnu avec qui on chatte sur internet : ne pas lui révéler d’informations personnelles et surtout vérifier tout ce qu’il dit. Quoiqu’il en soit, cette dangereuse faille de sécurité met en péril l’avenir de l’intelligence artificielle générative.

Source : Wired

ChatGPT

Antoine Barsacq

Twitter LinkedIn

Pratiquement né avec une manette de Nintendo64 dans les mains, j’ai rapidement préféré la souris…

Les commentaires sont fermés.

Les derniers articles

Un nouveau parc Universal va voir le jour en Angleterre
24 avril 2025 12:00
Rester sur Windows 10 pourrait bientôt vous coûter cher
24 avril 2025 09:28
Xiaomi : 26 modèles ne recevront plus de mise à jour, êtes-vous concernés ?
24 avril 2025 09:10
Les voitures d’occasion soumises, elles aussi, au malus écologique…
23 avril 2025 17:00
Google et Samsung travailleraient ensemble sur des lunettes de réalité intelligentes
23 avril 2025 12:30
Après 67 ans dans l’espace, le Satellite Vanguard-1 pourrait être ramené sur Terre
23 avril 2025 08:30
Créez gratuitement votre assistant IA avec Gemini
22 avril 2025 17:30
Pour obtenir de l’eau potable sur la Lune, vous n’avez besoin que d’un micro-ondes
22 avril 2025 12:30
Android 16 : la Bêta 4 est lancée
22 avril 2025 08:30
Le REDMAGIC 10 Air débarque en France
18 avril 2025 17:30

ChatGPT : une faille de sécurité insoluble plombe le futur des chatbots

Les attaques par injection indirecte d’invite, un danger de l’IA

Comment faire pour utiliser ChatGPT en toute sécurité ?

La rédaction vous conseille aussi...