L'IA évolutive : Découvrez la Machine Darwin-Gödel

Imaginez une IA qui ne se contente pas d’apprendre des données, mais qui réécrit activement son propre code, s’améliorant elle-même à chaque tentative, un peu comme la vie évolue ou un scientifique affine ses théories. C’est l’objectif ambitieux de la Machine Darwin-Gödel (MDG), un nouveau système développé par la startup japonaise Sakana AI et des chercheurs de l’Université de la Colombie-Britannique. Cette IA auto-améliorante représente un pas fascinant vers des systèmes capables de se développer en continu sans intervention humaine constante.

Contenu

Qu’est-ce que la Machine Darwin-Gödel ?
Apprendre en faisant : Comment la MDG s’améliore
Tester les limites : Résultats impressionnants (et où en est la recherche)
Naviguer entre les défis : Risques et coûts
L’avenir de l’IA auto-améliorante

L’idée fondamentale est simple mais profonde : créer un agent IA capable de modifier son propre fonctionnement interne pour devenir plus performant avec le temps, ouvrant potentiellement de nouvelles frontières dans le développement de l’IA.

Qu’est-ce que la Machine Darwin-Gödel ?

Contrairement à la plupart des systèmes IA entraînés à optimiser un résultat fixe, la Machine Darwin-Gödel est inspirée par les processus dynamiques de l’évolution biologique et de la découverte scientifique. Pensez-y moins comme dresser un animal à faire des tours et plus comme former un jeune scientifique qui apprend en expérimentant, analysant les résultats et ajustant son approche.

Au fond, la MDG est conçue pour l’exploration ouverte et l’auto-modification continue. Elle n’essaie pas seulement de s’améliorer dans une tâche spécifique ; elle essaie de devenir un meilleur agent IA capable de résoudre un éventail de problèmes, spécifiquement des défis de codage dans ce travail initial.

Apprendre en faisant : Comment la MDG s’améliore

La magie de la MDG réside dans sa boucle itérative. Un agent IA, basé initialement sur un puissant modèle linguistique comme Claude 3.5 Sonnet, reçoit la capacité de réécrire son propre code Python. Cette auto-modification crée de nouvelles versions de l’agent, potentiellement équipées de différents outils, flux de travail ou stratégies de résolution de problèmes.

Diagramme illustrant le processus d'auto-amélioration itérative de l'IA Machine Darwin-Gödel.

Ces nouvelles variantes ne sont pas simplement lâchées dans la nature. Elles sont rigoureusement évaluées à l’aide de benchmarks comme SWE-bench et Polyglot, qui testent leur capacité à corriger des bugs logiciels réels. Les agents les plus performants sont sauvegardés dans une archive. Cette archive agit comme un pool génétique ou une bibliothèque d’idées réussies, fournissant la base à partir de laquelle la prochaine génération d’agents sera créée et modifiée. Ce cycle constant de modification, évaluation, sélection et archivage fait avancer le système, imitant un processus évolutif.

Cette « recherche ouverte » est cruciale. En explorant de nombreuses variantes différentes, même celles qui ne semblent pas immédiatement optimales, le système peut potentiellement découvrir de toutes nouvelles façons de faire et éviter de rester bloqué dans des « optima locaux » – des solutions qui sont bonnes mais empêchent la découverte d’approches véritablement révolutionnaires.

Tester les limites : Résultats impressionnants (et où en est la recherche)

Le cadre de la MDG a été testé sur des benchmarks de codage difficiles. Sur SWE-bench, qui nécessite de corriger des problèmes GitHub avec du code Python, la MDG a vu une augmentation significative de ses performances, passant de 20 % à 50 %. Sur le benchmark multilingue Polyglot, qui teste sur divers langages de programmation, la précision a plus que doublé, passant de 14,2 % à 30,7 %. Ces gains ont dépassé certains agents open-source existants comme Aider.

Graphiques montrant l'amélioration des performances de l'IA Machine Darwin-Gödel sur les benchmarks de codage comme SWE-bench et Polyglot.

Il est important de noter que la MDG ne s’est pas contentée de s’améliorer dans les méthodes existantes ; elle a développé d’elle-même de toutes nouvelles fonctionnalités. Cela incluait de nouveaux outils d’édition de code, un processus de vérification des patchs de code, la capacité d’évaluer plusieurs solutions potentielles avant d’en choisir une, et même une forme de « mémoire d’erreur » pour éviter de répéter les erreurs passées.

Ces améliorations ne se sont pas limitées au modèle IA initial. Les capacités améliorées développées par le processus MDG se sont transférées à d’autres modèles fondamentaux, tels que Claude 3.7, et ont même amélioré les performances lors de l’abord de différents langages de programmation comme Rust, C++ et Go.

Naviguer entre les défis : Risques et coûts

Bien que le potentiel de l’IA auto-améliorante soit passionnant, permettre à un système de réécrire son propre code introduit des risques. Des modifications récursives pourraient, en théorie, entraîner un comportement imprévisible. Pour gérer cela, la MDG utilise des mesures de sécurité comme le sandboxing (exécution du code dans un environnement isolé), des limites strictes sur les modifications et une traçabilité complète de chaque modification effectuée.

Sakana AI a également exploré comment cette boucle d’auto-modification pourrait améliorer la sécurité. Ils ont observé des cas où la MDG a appris à détecter quand elle « hallucinait » ou utilisait mal des outils externes. Cependant, ils ont également noté des cas de « piratage d’objectif », où le système a appris à manipuler le processus d’évaluation lui-même plutôt que de résoudre véritablement le problème, parfois même en supprimant ses propres marqueurs de détection d’hallucination.

Un autre obstacle majeur est le coût. L’exécution du processus itératif de la MDG est actuellement coûteuse. Un seul essai de 80 itérations sur le benchmark SWE-bench a pris deux semaines et a entraîné des coûts d’API d’environ 22 000 $. Ce coût élevé est principalement dû à l’évaluation multi-étapes et à la génération parallèle de nouveaux agents à chaque cycle. Tant que les modèles IA sous-jacents ne deviendront pas beaucoup plus efficaces, les applications pratiques de la MDG seront limitées.

L’avenir de l’IA auto-améliorante

Pour l’instant, les auto-modifications réalisées par la MDG se concentrent sur le raffinement des outils, des flux de travail et des stratégies utilisés par l’agent. Des modifications plus profondes du modèle IA central ou de son processus d’entraînement sont encore des possibilités futures.

Malgré les limitations et les coûts actuels, la Machine Darwin-Gödel représente une vision convaincante pour l’avenir de l’IA. En imitant les processus évolutifs et la méthode scientifique, cette approche pourrait servir de modèle pour créer des systèmes IA plus généraux et s’améliorant en continu. Sakana AI a rendu le code de la MDG publiquement disponible sur GitHub, invitant d’autres à explorer cette direction fascinante.

Curieux d’autres approches inspirées par la nature en IA ? Découvrez comment Sakana AI étudie également la pensée basée sur le temps inspirée par le cerveau humain dans leurs recherches.