Les évolutions des modèles d’intelligence artificielle sont en train de dépasser de loin le simple ChatBot, la preuve avec cette présentation de Claude 3.5.
Les chatbot IA, vous commencez à connaître, depuis la sortie de ChatGPT, il en est apparu des tas : Gemini, Claude, et les autres.
Aujourd’hui, il est donc question de Claude, le modèle d’intelligence artificielle d’Anthropic. Comme ses concurrents, le chatbot ne cesse d’évoluer depuis sa première version. Et, toujours comme ses concurrents, ses progrès sont à chaque fois phénoménaux.
Claude 3 était déjà capable de lire un article, faisait moins d’erreur que ses prédécesseurs, comprenait les questions longues et pouvait analyser des fichiers bureautiques (même de plusieurs pages). Et pour ne rien enlever, il est possible de tester le modèle gratuitement (dans sa version Sonnet).
Quelles sont les nouveautés de Claude 3.5 ?
Comme précédemment, c’est sous la forme d’une vidéo de présentation qu’Anthropic a dévoilé les premières images de Claude 3.5, la dernière mouture de son modèle IA.
On y voit Sam Ringer, chercheur chez Anthropic dévoiler la nouvelle fonctionnalité phare de Claude 3.5 : la prise de contrôle de votre ordinateur.
Il s’agit ici de créer une IA d’aide au travail, capable de trouver des informations, de réaliser des tâches spécifiques, et de vous libérer du temps pour réaliser d’autres travaux, plus complexes.
Bien entendu, nous sommes toujours ici dans un fonctionnement de type Chatbot. Ainsi, vous devez écrire, toujours en langage courant, ce que vous souhaitez que l’IA réalise comme actions. Dans la vidéo, on voit Sam Ringer demander à l’IA de récupérer des informations dans l’un des logiciels ouverts afin de remplir un formulaire situé dans un onglet du navigateur web. Les informations se trouvent à la fois quand un fichier de type tableur et dans un moteur de recherche.
L’IA doit alors comprendre les entrées du formulaire afin d’être capable d’aller chercher les informations nécessaires pour le remplir. Une fois le prompt saisi, il suffit de lancer l’exécution.
Pendant l’exécution, Claude indique dans une fenêtre située à gauche de l’écran toutes les étapes qu’il réalise au fur et à mesure qu’il les réalise. On peut aussi voir les actions en temps réel de Claude : la souris se déplace, les fenêtres actives changent, les zones de texte se remplissent, etc. C’est assez impressionnant.
Encore plus impressionnant, ce test grandeur nature réalisé par Ethan Mollick, un professeur d’IA basé à l’université de Pennsylvanie et relayé par Le Monde Informatique. Le scientifique de la Wharton School a demandé à Claude 3.5 Sonnet de réaliser plusieurs actions.
La première fut de réaliser un plan de cours complet pour l’étude de Gatsby le magnifique, en divisant le livre en parties accessibles par les étudiants et en réalisant un plan de travail pour chacune. Il a ainsi regardé Claude télécharger le livre (dont les droits sont libres), rechercher des plans de cours sur internet, remplir un tableur avec les données recueillies, etc. Le résultat était plus que satisfaisant (bien qu’il est possible qu’il ait contenu quelques erreurs).
La deuxième tâche donnée à cette nouvelle version de Claude a été de jouer à un jeu en ligne nommé Universal PaperClips où l’utilisateur joue le rôle d’une IA qui doit produire des trombones pour détruire l’humanité (hum, hum). Ethan Mollick a alors donné l’adresse web du jeu et demandé à l’IA de gagner, sans même lui expliquer ce qu’il fallait faire.
L’IA a ainsi directement compris comment jouer. Au fur et à mesure du jeu, elle indiquait dans sa fenêtre de suivi les avancées réalisées et les conclusions qu’elle en tirait. Pour en savoir plus, n’hésitez pas à lire le compte rendu écrit par Ethan Mollick.
L’avenir de l’IA est déjà là.