GPT-5 va révolutionner la façon dont nous interagissons avec l’IA. Bien plus puissant que GPT-4, le futur modèle de langage de ChatGPT est actuellement en cours de développement et d’entraînement dans les labos d’OpenAI. Voici tout ce que nous savons à ce stade.
GPT-5 est le nom du prochain modèle de langage développé par OpenAI pour propulser ChatGPT, son puissant chatbot. Il succédera ainsi à GPT-4o qui est actuellement le modèle le plus performant de l’entreprise. Cette nouvelle itération promet des capacités d’intelligence artificielle inédites, notamment dans la compréhension et la génération du langage naturel, la prise en charge du format vidéo, la réduction des erreurs factuelles, la personnalisation et la modularité.
À l’heure où le patron d’OpenAI s’inquiète du développement trop rapide de son intelligence artificielle, voici ce que l’on sait sur ce projet ambitieux.
🧐 Qu’est-ce que GPT-5 ?
GPT-5 est l’acronyme de Generative Pre-trained Transformer 5, qui signifie en français Transformateur Génératif Pré-entraîné 5. Il s’agit d’un modèle de langage, c’est-à-dire d’un système d’intelligence artificielle capable de comprendre et de produire du texte, de la parole, du code ou des images à partir de données textuelles.
GPT-5 est la cinquième version de ce modèle, qui a commencé avec GPT en 2018, puis GPT-2 en 2019, GPT-3 en 2020, GPT-4 en 2023.
GPT-5 est basé sur l’architecture des transformateurs, qui sont des réseaux de neurones artificiels capables de traiter des séquences de données de manière parallèle et efficace. Il utilise le principe de l’apprentissage profond, qui consiste à entraîner le modèle sur de grandes quantités de données pour qu’il apprenne à reconnaître des motifs et à les reproduire.
GPT-5 est pré-entraîné sur un corpus de données gigantesque, incluant des textes provenant d’Internet, des livres, des articles, des réseaux sociaux, etc. Ce pré-entraînement lui permet d’acquérir une connaissance générale du langage et de ses règles. GPT-5 peut ensuite être adapté à des tâches spécifiques, comme la traduction, la rédaction, la conversation, etc., en utilisant des données supplémentaires liées à ces tâches.
GPT-5 sera le modèle le plus puissant jamais créé par OpenAI, et sans doute par l’humanité. Il devrait dépasser largement les performances de GPT-4, qui comptait déjà 175 milliards de paramètres, c’est-à-dire de variables ajustables qui déterminent le comportement du modèle. Le nombre exact de paramètres de GPT-5 n’a pas été révélé, mais il pourrait atteindre le trillion, selon certaines estimations.
GPT-5 devrait également utiliser des techniques d’optimisation et de parallélisation avancées, pour réduire le temps et le coût de son entraînement. D’après le patron d’OpenAI, le futur modèle surclassera GPT-4 dans tous les domaines. « L’essence de l’avancée de GPT-5 réside dans son intelligence générale, qui promet des améliorations dans quasiment toutes les tâches qu’elle entreprend », assure Sam Altman. Selon le dirigeant, une nouvelle frontière sera franchie “dans la capacité de l’IA à comprendre, interagir et aider”.
📅Quelle est la date de sortie possible de GPT-5 ?
OpenAI a poursuivi sa progression rapide dans le développement de ses modèles linguistiques de grande taille (LLM). Mais quid de GPT-5 ? Alors qu’un rapport affirmait qu’il sortirait cet été, il faudra finalement patienter beaucoup plus longtemps. Mira Murati, directrice de la technologie, a indiqué qu’il serait lancé fin 2025 ou début 2026. Et de préciser qu’il aura une intelligence de niveau doctorant pour certaines tâches.
Actuellement, GPT-4o est disponible gratuitement pour les utilisateurs avec toutefois un nombre d’interactions limitées (le chatbot repasse sur GPT-3,5 lorsque vous avez dépassé votre quota). Il faut passer à ChatGPT Plus pour obtenir plus d’interactions avec le modèle le plus puissant du moment. Nous pouvons supposer que GPT-5 arrivera d’abord sur ChatGPT Plus, qui coûte une vingtaine d’euros par mois.
👉 Quelles seront les nouveautés de GPT-5 ?
GPT-5 devrait apporter des nouveautés majeures par rapport aux versions précédentes : il se dit même qu’il sera très proche de l’intelligence humaine. Ces nouveautés concernent notamment la prise en charge de la vidéo, la réduction des hallucinations et la personnalisation et la modularité.
Prise en charge de la vidéo
GPT-5 sera le premier modèle d’OpenAI à être capable de traiter le format vidéo, en plus du texte, de la parole, du code et de l’image, a annoncé Sam Altman dans un podcast (ci-dessous).
Cela signifie qu’il pourra analyser et générer des vidéos à partir de données textuelles, par exemple en créant un clip à partir d’une description (comme Sora), ou en décrivant le contenu d’une vidéo. Cette capacité représente un défi technique considérable, car la vidéo implique de traiter des données multimodales, temporelles et spatiales.
Réduction des hallucinations
GPT-5 devrait être plus fiable et plus précis que les modèles précédents, en évitant de produire des réponses erronées ou inventées, appelées hallucinations. Ce problème est dû au fait que les modèles de langage ne disposent pas d’une véritable connaissance du monde, mais se basent uniquement sur les données qu’ils ont vues lors de leur entraînement.
GPT-5 devrait être capable de vérifier la véracité des informations qu’il génère, en utilisant des sources externes ou en se référant au contexte. Il devrait également être capable de reconnaître et de signaler ses propres incertitudes.
Personnalisation et modularité
GPT-5 devrait être plus personnalisable et plus modulaire que les modèles précédents, en permettant aux utilisateurs de choisir et de combiner les fonctionnalités qu’ils souhaitent utiliser.
Par exemple, il devrait être possible de sélectionner le niveau de formalité, de créativité ou d’humour du modèle, ou encore de lui donner une personnalité ou un style particulier. Il devrait également être possible de connecter le modèle à d’autres outils ou applications.
🤔 Quelles seront les utilisations de GPT-5 ?
Dans le domaine de la conversation, GPT-5 devrait être capable de mener des conversations naturelles et pertinentes avec les utilisateurs, en utilisant le texte ou la parole. Il devrait pouvoir répondre à des questions, donner des informations, fournir des conseils, raconter des histoires, faire des blagues, etc.
Il devrait également pouvoir s’adapter au profil, aux besoins et aux préférences de chacun, en créant une relation personnalisée et empathique. GPT-5 pourrait ainsi être utilisé comme un assistant virtuel, un coach, un enseignant, un thérapeute, etc.
Même si les professionnels de santé ne recommandent pas l’utilisation des chatbots pour s’auto-diagnostiquer, loin de là, GPT-5 pourrait être utilisé pour aider les médecins à diagnostiquer des maladies, à développer de nouveaux traitements et à communiquer avec leurs patients.
Dans le domaine de la rédaction, GPT-5 devrait être capable de rédiger des textes de qualité, dans différents genres et formats. Il devrait pouvoir respecter les règles grammaticales, orthographiques et stylistiques du langage, ainsi que les consignes et les objectifs donnés par les utilisateurs.
Il devrait également pouvoir générer des textes originaux, créatifs et cohérents, en évitant le plagiat ou la répétition. Il devrait ainsi être utilisé comme un véritable outil d’aide à la rédaction, de révision, de traduction, de synthèse, etc.
Dans le domaine de la génération, GPT-5 devrait être capable de générer des contenus multimodaux, comme des images, du code ou des sons, mais surtout des vidéos donc, et ce, à partir de données textuelles. Il devrait pouvoir créer des contenus réalistes, esthétiques et adaptés aux demandes.
Il devrait également pouvoir modifier, améliorer ou transformer des contenus existants, en utilisant des techniques comme le style transfer, le super-resolution, mais surtout, le deepfake. Une avancée que certains voient comme une grande source d’inquiétude et de désinformation. GPT-5 pourrait ainsi être utilisé comme un outil de création, d’édition, de restauration… Ou de manipulation de contenus.
Dans l’éducation, GPT-5 pourrait bien être utilisé pour fournir des tutoriels personnalisés, créer des expériences d’apprentissage immersives et aider les élèves à développer leurs compétences en communication et en pensée critique. Dans l’entreprise, le modèle pourrait être utilisé pour générer des rapports, traduire des documents, rédiger des contrats et même créer de nouvelles idées de produits.