Cette IA apprend à jouer à Minecraft en visionnant 70 000 h de vidéos YouTube

OpenAI a mis au point une intelligence artificielle capable de jouer à Minecraft en se basant sur de nombreuses heures de gameplay publiées sur YouTube.

Image 1 : Cette IA apprend à jouer à Minecraft en visionnant 70 000 h de vidéos YouTube
L’IA à l’assaut de Minecraft – Crédit : OpenAI

Nous n’avons pas fini d’être étonnés par le potentiel infini de l’intelligence artificielle capable par exemple de prédire la mort de votre disque dur. OpenAI vient de dévoiler les contours de sa dernière réalisation : une intelligence artificielle capable de comprendre les rouages de Minecraft. Pour ce faire, les chercheurs ont mis au point un algorithme de pré-formation vidéo (Video PreTraining). Lequel s’est nourri de 70 000 heures de séquences de jeu disponibles sur YouTube grâce à la puissance de calcul de 720 GPU.

Alors que des IA ont déjà réussi à évoluer dans MC, elles étaient cantonnées à des moutures simplifiées. Contrairement à celle créée par OpenAI qui évolue dans la même version que les joueurs humains en utilisant l’équivalent du combo souris-clavier.

Dans un premier temps, le modèle de clonage comportemental a réussi à accomplir des tâches qui sont quasiment impossibles à réaliser avec seulement un apprentissage par renforcement à partir de zéro. L’IA a tout d’abord appris à casser des arbres pour ramasser des bûches, lesquelles ont été transformées en planches afin de construire une table de craft.

Minecraft : l’apprentissage par renforcement à porté ses fruits

L’IA est ensuite parvenue à nager, à chasser des animaux pour se sustenter et même à maîtriser la technique du “saut de pilier” qui consister à effectuer plusieurs sauts successifs en plaçant un bloc sous le personnage. Exploration de villages, découverte de coffres, construction d’abris, fabrication d’outils… L’IA a même réussi à crafter une pioche en diamant – un objectif qui prend près de 20 minutes à accomplir pour un joueur humain (24 000 actions).

À lire > Minecraft : il réussit à crafter l’Infinity Sword, l’épée ultime en PvP

Pour en arriver là, OpenAI a dû ruser. Et pour cause, les images brutes ne sont pas suffisantes pour permettre à l’IA d’apprendre. Les vidéos montrent bien ce qui peut être fait mais sans expliquer la procédure. OpenAI a donc mobilisé des sous-traitants qui ont étiqueté les actions de base de MC en créant un autre algorithme. Lequel s’est chargé d’annoter toutes les vidéos avec des invites de saisie au clavier et à la souris. De quoi permettre à l’IA d’apprendre en observant les actions humaines, plutôt qu’en testant des actions aléatoires.

Cette IA prometteuse pourrait servir dans des domaines plus élargis, comme OpenAI le suggère dans sa conclusion : “Bien que nous n’avons testé l’IA uniquement dans Minecraft, le jeu est très ouvert et l’interface humaine native (souris et clavier) est très générique. Par conséquent, nous pensons que nos résultats sont de bon augure pour d’autres domaines similaires, par exemple l’utilisation d’un ordinateur”.