Dans sa dernière vidéo, OpenAI a annoncé l’arrivée des deux nouveaux modèles nommés o3 et o3-mini. Leur particularité : ils dépassent de loin les modèles actuels et pourraient changer votre vision de l’IA.
Vous le savez sans doute déjà, mais Open AI est l’entreprise spécialisée dans l’intelligence artificielle qui a lancé la grande mode des chatbot IA, grâce à ChatGPT. ChatGPT est basé sur le modèle de LLM GPT qui en est actuellement à sa version GPT-4o.
En parallèle de ChatGPT, OpenAI utilise son modèle de langage IA pour son fameux générateur d’image, nommé DALL-E. DALL-E en est actuellement à sa version 3. Vous pouvez d’ailleurs l’utiliser gratuitement grâce au partenariat entre OpenAI et Microsoft qui propose DALL-E 3 directement au sein de Copilot ou de Microsoft Bing Image Creator.
Cependant l’amélioration de ChatGPT reste l’une des cibles principales d’OpenAI. On peut ainsi citer le projet Strawberry qui lui permet de s’améliorer en maths et programmation, ou l’arrivée d’une offre ChatGPT spécialement conçue pour les étudiants et professeurs. En parallèle, Open AI travaillerait aussi sur un navigateur internet.
Les évolutions de GPT-4o
Depuis sa version 4, GPT propose plusieurs modèles d’IA spécialisés. Nommé o1-preview et o1-mini, ils permettent à l’IA de passer plus de temps à réfléchir aux questions qui lui sont posées afin de ne pas répondre n’importe quoi (comme nous avons pu le voir à de nombreuses reprises par le passé).
Aujourd’hui ces modèles évoluent encore avec l’arrivée annoncée des modèles o3 et o3-mini courant 2025. Ces modèles ont été présentés par Sam Altman, PDG de OpenAI, lors de la dernière vidéo des 12 jours d’OpenAI.
Tout comme la version o1, la version o3 a été élaborée afin d’améliorer la partie réflexion et pensée de GPT. De quoi concurrencer sérieusement les derniers modèles de Claude. Notez que si OpenAI n’est pas passé par o2, c’est sans doute à cause d’un problème de marque (O2 est une entreprise de télécommunication).
GPT-4o3 arrive alors que les utilisateurs attendent toujours GPT-5 qui était annoncé en juin 2024, mais qui tarde à arriver. D’ailleurs ce n’est pas encore pour demain. En effet, un rapport paru dans le Wall Street Journal indique que le développement de GPT-5 (nom de code Orion) serait au point mort, les performances du modèle de langage étant loin des attentes de l’équipe de développement.
C’est sans doute pour cela que l’entreprise a décidé de changer de direction et d’améliorer GPT-4o à la place. Notons par ailleurs que le but de GPT-5 est essentiellement d’améliorer la puissance et la rapidité de calcul de l’IA. Alors que les développements o sont plus liés à la qualité de réponse. Il semble donc que OpenAI ait décidé, pour le moment, de privilégier la seconde piste.
Et ce n’est pas une mauvaise idée du tout. En effet, les frasques des chatbot IA, qui imaginent des réponses lorsqu’ils ne disposent pas de la réponse à votre question sont légion. Réaliser un modèle de langage qui vérifie ses propres réponses est donc une idée qui devrait plaire au grand public, lassé d’obtenir des réponses trop imaginatives.
Et c’est exactement ce que propose le modèle o3 proposé par OpenAI. Ce modèle, lorsque vous lui posez une question, va réfléchir à la réponse au lieu de vous répondre le plus vite possible. Il dispose ainsi de sa propre chaîne de réflexion (“private chain of thought”). Un peu comme quand vous “tournez sept fois la langue dans votre bouche” avant de répondre…
Comment cela fonctionne ? Eh bien de manière assez étrange en fait. Ainsi lorsque GPT-4o3 va répondre à une question, il formule d’abord sa réponse en interne. Et là, c’est comme si une série de spécialistes allaient analyser la réponse et réfléchir à sa véracité. C’est comme un dialogue internet que l’IA aurait avec elle-même. Cela vous paraît étrange ? En fait pas tant que ça, car cela s’apparente à la façon dont nous résolvons, nous aussi, des problèmes complexes.
Seul bémol de l’équation : cet ajout de propriété de pensée supplémentaire rend le modèle légèrement moins rapide. La vitesse de réponse reste cependant assez rapide, et le résultat en vaut la chandelle grâce à des réponses bien plus précises, notamment en codage informatique, science ou mathématiques.
Et cerise sur le gâteau : vous pourrez ajuster la chaîne de réflexion et indiquer si vous souhaitez qu’elle soit plus courte, car vous avez besoin d’une réponse rapide, ou plus longue, afin d’être certain du résultat.
Bon soyons clairs, même si GPT-4o3 propose des résultats spectaculaires, supérieurs à GPT-4o1 (qui était déjà waouh), on est encore loin de la pensée humaine, notamment sur des sujets précis et spécialisés.
Bien entendu, les nouveaux modèles o3 seront accessibles aux utilisateurs Microsoft (grâce au partenariat entre les deux entreprises) dès leur sortie en janvier 2025 (o3-mini d’abord puis o3 complet). Ils sont d’ailleurs déjà en cours de test via Copilot Labs.