Depuis plusieurs semaines, un spectacle intrigant se déroule en direct sur Twitch : ChatGPT, le célèbre modèle d’intelligence artificielle développé par OpenAI, tente de terminer Pokémon Rouge… tout seul.
Une lente progression
Oui, vous avez bien lu : une IA joue seule à ce classique de la Game Boy sorti en 1999. Ce défi technologique, aussi amusant qu’ambitieux, se déroule sur la chaîne GPT Plays Pokémon, où l’on peut suivre en temps réel les efforts de l’IA.

Après 80 heures de jeu, ChatGPT n’avait réussi à obtenir que deux badges sur les huit nécessaires pour accéder à la Ligue Pokémon. Une performance modeste, surtout quand on sait qu’un joueur humain moyen termine le jeu en une quarantaine d’heures.
Pourtant, ChatGPT avait bien démarré. L’IA a choisi Bulbizarre comme Pokémon de départ. Un choix stratégique, car ses attaques de type Plante facilitent les premiers combats contre Pierre (type Roche) et Ondine (type Eau), les deux premiers champions d’arène.
Mais les choses se sont compliquées par la suite. Contrairement à un humain, ChatGPT analyse chaque action longuement, hésite, et fait régulièrement des erreurs. Il peut lui falloir plusieurs minutes pour décider d’un simple mouvement en combat ou pour naviguer dans les menus du jeu.
Une IA face à la complexité d’un jeu rétro
Après plus de 301 heures de jeu, l’IA a tout de même franchi un cap impressionnant : elle possède aujourd’hui 7 badges sur les 8 requis. Mais la route vers la Ligue Pokémon reste semée d’embûches.

Pourquoi un tel défi ? Parce que sous ses airs de jeu rétro, Pokémon Rouge représente un terrain d’entraînement stratégique idéal pour une IA. Le jeu repose sur des mécaniques complexes : gestion de types (Feu, Eau, Plante, etc.), optimisation des ressources, planification à long terme et prises de décisions en temps réel. Pour un modèle comme ChatGPT, conçu pour résoudre des problèmes, c’est un excellent test de ses capacités de planification et de raisonnement.
Malgré cet exploit en cours, la performance reste modeste si on la compare à d’autres initiatives. En 2014, le projet Twitch Plays Pokémon, où des milliers de joueurs contrôlaient collectivement le jeu via le chat Twitch, avait réussi à battre les trois premiers champions en moins de 50 heures et à terminer le jeu en 16 jours.
Plus récemment, une autre IA s’est également lancée dans le défi. Gemini, le modèle développé par Google, joue lui aussi à Pokémon Rouge en direct sur sa propre chaîne Twitch et a réussi à terminer le jeu en environ 406 heures.

Ces expérimentations montrent que si des IA comme ChatGPT ou Gemini sont capables de rédiger une dissertation ou de générer du code, elles atteignent rapidement leurs limites face à des tâches demandant une compréhension dynamique, de la mémoire stratégique et une adaptation en temps réel.
En somme, terminer Pokémon Rouge reste un vrai défi pour l’intelligence artificielle, malgré des centaines d’heures de jeu. Et cela en dit long sur la complexité (parfois sous-estimée) de certains jeux vidéo, et sur les marges de progression qu’il reste à franchir pour les IA généralistes.