ChatGPT est un mauvais médecin, ses diagnostics sont très souvent erronés

Antoine Barsacq , le 4 janvier 2024

ChatGPT est particulièrement mauvais en médecine pédiatrique. Une nouvelle étude montre que le chatbot d’OpenAI donne 72% de réponses erronées et 11% de réponses incomplètes lorsqu’il est confronté à des cas théoriques d’enfants malades par une invite.

enfant malade pédiatrie médecine ChatGPT — © Envato

ChatGPT ne sait pas s’y prendre avec les enfants. Une étude publiée cette semaine dans JAMA Pediatrics montre que la dernière version du chatbot, GPT-4, est particulièrement mauvaise en médecine pédiatrique. Lorsqu’il s’agit de diagnostiquer des enfants malades, son taux d’exactitude n’est que de 17 %.

Pour arriver à ce résultat, les chercheurs ont confronté le chatbot à 100 cas réels publiés dans des revues médicales entre 2013 et 2023. Ces cas se présentent sous forme de mise en situation, avec un quiz ou un défi à résoudre. Les médecins qui lisent ces revues scientifiques tentent ainsi de trouver le bon diagnostic, en se basant sur les informations dont disposaient les médecins réellement confrontés à la situation.

Pour tester ChatGPT, les chercheurs ont tout simplement transposé le texte pertinent issue de la publication dans l’invite et lui ont demandé de donner un diagnostic. Le chatbot d’OpenAI a obtenu la bonne réponse dans seulement 17 des 100 cas. Il s’est clairement trompé dans 72 cas. Dans les 11 cas restants, il a établi un diagnostic incomplet.

ChatGPT n’est pas adapté à la médecine pédiatrique

Les chercheurs notent que par rapport aux cas adultes, les cas pédiatriques nécessitent une plus grande prise en compte de l’âge du patient, ce qui pourrait expliquer ces mauvais résultats. En effet, il est particulièrement difficile de diagnostiquer les maladies chez les jeunes enfants, car ils ne sont pas en mesure de décrire ou d’exprimer clairement les symptômes qu’ils ressentent.

Ainsi, les pédiatres ne seront pas mis au chômage par ChatGPT de sitôt. Les auteurs soulignent cependant que l’étude permet d’identifier les faiblesses qui ont conduit au taux d’erreur élevé de ChatGPT. Parmi ses mauvaises réponses, les chercheurs ont noté que ChatGPT semblait avoir du mal à repérer les relations connues entre plusieurs pathologies, ce qu’un véritable médecin peut déceler.

Les chercheurs pensent que le chatbot pourrait être amélioré en étant formé à partir de littérature médicale fiable. Jusqu’ici, le chatbot a été entrainé sur un corpus d’informations trouvées sur Internet, qui peuvent être inexactes ou erronées. C’est la même recommandation de spécialisation qu’établie par certains universitaires pour concevoir des outils capable de reconnaître les articles écrits par ChatGPT.

Antoine Barsacq

Twitter LinkedIn

Pratiquement né avec une manette de Nintendo64 dans les mains, j’ai rapidement préféré la souris…

Les commentaires sont fermés.

Les derniers articles

Le REDMAGIC 10 Air débarque en France
18 avril 2025 17:30
Vers des publicités dans les taxis sans chauffeur ?
18 avril 2025 12:30
La bande-annonce du nouveau Mission : Impossible montre des cascades à couper le souffle
18 avril 2025 08:30
Nintendo Direct : Mario Kart World, nouveaux parcours, nouveaux objets et nouveaux modes
17 avril 2025 17:30
Et si la poussière de la Lune permettait d’alimenter une station lunaire ?
17 avril 2025 12:30
Les 15-24 ans seraient-ils accros à l’écran plus que les autres ?
17 avril 2025 08:30
Beetlejuice, un 3ème film est confirmé
16 avril 2025 17:00
Meilleure formation développeur web en 2025 : notre comparatif pour réussir sa reconversion dans la tech
16 avril 2025 16:28
Une IA pour prédire les incendies provoqués par la foudre
16 avril 2025 12:30
OnePlus 13T : date de sortie et design compact sont confirmés
16 avril 2025 08:30

ChatGPT est un mauvais médecin, ses diagnostics sont très souvent erronés

ChatGPT n’est pas adapté à la médecine pédiatrique

La rédaction vous conseille aussi...