ChatGPT, Llama… Plus les IA se développent, moins elles savent répondre à des questions simples

Nathalie Jourand , le 26 septembre 2024

Les modèles de langage s’améliorent pour répondre à toutes vos questions, mais les chatbots continuent de faire trop d’erreurs.

Image 1 : ChatGPT, Llama... Plus les IA se développent, moins elles savent répondre à des questions simples — © Envato

Alors que l’Intelligence artificielle se développe sur tous nos appareils ou se transforme en outil de triche, des scientifiques espagnols en démontrent les limites.

Selon une étude menée par des scientifiques de l’Université de Valence en Espagne, et publiée sur le site scientifiq ue nature, les modèles de langage deviennent plus puissants et plus faciles à utiliser, au détriment de la fiabilité de leur réponse. En effet, les analystes mettent en lumière une corrélation inversée entre l’augmentation de la taille (c’est-à-dire du volume de données et des ressources informatiques gérées) et le nombre d’erreurs sur des questions jugées simples pour des humains.

Les chercheurs ont utilisé différentes techniques telles que le réglage fin des instructions, l’apprentissage par renforcement à partir du retour d’information humain (RLHF) ou les techniques de modération du filtrage de sortie sur les trois modèles de langages les plus puissants : le modèle GPT, la série des LLaMA (de Meta) et la suite BLOOM (de BigScience).

Quels sont les constats de cette étude ?

L’étude s’intéresse, entre autres, à la sensibilité des modèles face aux variations de formulation des requêtes (prompts). Quinze formulations différentes ont été testées pour chaque requête, afin de voir comment les modèles réagissent aux changements de langage. Résultat : les versions brutes des modèles, notamment pour les tâches simples comme les additions, se montrent très sensibles à ces variations. Cependant, les modèles plus récents et ajustés, comme GPT-4, sont plus stables face à ces changements, bien que leur taux d’erreurs augmente avec la difficulté des tâches.

Un autre constat clé de l’étude : les modèles plus récents, bien qu’améliorés, sont moins prudents. Ils donnent plus souvent des réponses incorrectes au lieu de choisir de ne pas répondre, ce qui est contraire aux attentes des utilisateurs. En effet, il est préférable de ne pas avoir de réponse plutôt qu’une réponse erronée. Bien que ces modèles soient plus fiables pour les tâches complexes, ils continuent de faire des erreurs sur des tâches simples. Il est donc toujours nécessaire de continuer à vérifier les réponses d’un chatbot plutôt que de lui faire aveuglément confiance.

ChatGPT

Les commentaires sont fermés.

Les derniers articles

Les voitures d’occasion soumises, elles aussi, au malus écologique…
23 avril 2025 17:00
Google et Samsung travailleraient ensemble sur des lunettes de réalité intelligentes
23 avril 2025 12:30
Après 67 ans dans l’espace, le Satellite Vanguard-1 pourrait être ramené sur Terre
23 avril 2025 08:30
Créez gratuitement votre assistant IA avec Gemini
22 avril 2025 17:30
Pour obtenir de l’eau potable sur la Lune, vous n’avez besoin que d’un micro-ondes
22 avril 2025 12:30
Android 16 : la Bêta 4 est lancée
22 avril 2025 08:30
Le REDMAGIC 10 Air débarque en France
18 avril 2025 17:30
Vers des publicités dans les taxis sans chauffeur ?
18 avril 2025 12:30
La bande-annonce du nouveau Mission : Impossible montre des cascades à couper le souffle
18 avril 2025 08:30
Nintendo Direct : Mario Kart World, nouveaux parcours, nouveaux objets et nouveaux modes
17 avril 2025 17:30

ChatGPT, Llama… Plus les IA se développent, moins elles savent répondre à des questions simples

Quels sont les constats de cette étude ?

La rédaction vous conseille aussi...