Vue lecture

GPT-5 Pro est capable de faire de nouvelles découvertes

Je viens de lire un truc super intéressant sur les nouvelles capacités de nos chers LLM qui devrait changer pas mal de choses aussi bien pour les scientifiques, que les développeurs ou n’importe qui, cherchant à faire du “neuf” avec les IA.

Moran Feldman et Amin Karbasi, deux chercheurs de l’université de Haifa et de Cisco Foundation AI, ont eu l’idée géniale de créer ce qu’ils appellent le “test de Gödel” . Un nom chelou mais qui cache l’idée suivante : est-ce qu’une IA peut résoudre des conjectures mathématiques encore jamais publiées ?

C’est à dire des trucs tellement nouveaux qu’elle ne peut pas les avoir mémorisés pendant son entraînement. Pour tester cela, nos chercheurs ont balancé cinq conjectures (des problèmes d’optimisation combinatoire qu’ils avaient spécialement concoctés pour l’occasion) à GPT-5 Pro, et là, surprise !!!

Sur le deuxième problème, GPT-5 Pro ne s’est pas contenté de chercher une solution. Le modèle a carrément réfuté leur conjecture originale en trouvant une meilleure approche qui, après vérification, s’est avérée correcte.

Et c’est exactement ce que Sebastian Bubeck, passé récemment de Microsoft à OpenAI, a observé aussi de son côté. Il a donné à GPT-5 Pro un problème ouvert d’optimisation convexe, un truc sur lequel les humains planchaient depuis un bon moment… Le modèle a alors réfléchi 17 minutes et a pondu une solution d’optimisation convexe valide et encore jamais trouvée. Bon, entre-temps des humains avaient déjà trouvé plus efficace, mais l’IA n’était pas au courant et a fait sa propre découverte indépendamment.

Les IA commencent donc à développer ce qu’on pourrait appeler un “esprit critique computationnel”. Elles ne se contentent plus de chercher LA solution qu’on leur demande, mais évaluent la pertinence même de la question.

Le test de Gödel révèle d’ailleurs les limites actuelles de façon assez claire car sur les cinq problèmes, GPT-5 Pro en a résolu trois correctement (enfin, presque correctement, avec quelques erreurs mineures). Le quatrième problème, qui nécessitait de combiner des data de deux papiers scientifiques différents a été un échec total. Et pour le cinquième, encore plus complexe, GPT-5 a proposé le même algorithme que les chercheurs avaient en tête mais s’est planté dans son analyse.

Selon l’étude , les preuves incorrectes “paraissaient initialement plausibles et même convaincantes” et ce n’est qu’après un examen détaillé que les failles profondes du raisonnement sont apparues. Comme d’hab, l’IA peut dire de la merde mais avec un tel aplomb qu’on aurait tendance à la croire, un peu comme un politique français qui témoigne sous serment.

Cette année 2025 marque vraiment un tournant dans les maths par IA. L’armée américaine, via la DARPA, a lancé le programme expMath qui vise carrément à créer des “co-auteurs IA” pour les mathématiciens. Des chercheurs de Caltech utilisent l’IA pour s’attaquer à la conjecture d’Andrews-Curtis, un problème de théorie des groupes vieux de 60 ans. Google Deepmind a découvert de nouvelles solutions à des problèmes de dynamique des fluides . Et, GPT-5 décroche même des médailles d’or aux Olympiades Internationales de Mathématiques.

On est bien sûr encore loin de remplacer les mathématiciens par des IA mais on s’approche de plus en plus d’outils capables d’accompagner, de challenger, de contredire ou de reformuler certains problèmes sans forcement recracher la soupe qu’on leur a servi lors de leur entrainement initial. Bref, l’IA semble être capable, en tout cas en maths, de faire preuve d’un peu (un peu seulement !!) de créativité grâce à son analyse de plus en plus fine des problèmes.

Je me demande maintenant si avec GPT-5 Pro, on peut accéder aussi à cet embryon de créativité pour d’autres choses plus quotidiennes, comme du code, ou des problèmes de la vie de tous les jours… Faudra tester !

  •