24 mars 2025

Une IA n'a pas le sens de l'humour… mais ça peut être drôle. 🤡

(republication LinkedIn)

Je teste en ce moment une approche où un agent surveille l'avancement d'autres agents via de simples fichiers texte. L'idée ? Laisser plusieurs sessions de hashtag#Cursor bosser en parallèle sur une même base de code, mais sur des sujets distincts pour éviter les chevauchements. Chaque agent rend compte de son avancement au fur et à mesure.
Pour l’instant, je règle le rôle du superviseur et je simule donc moi-même les retours des agents.

🔍 Exemple de feedback des agents :
🟠 Agent A :
J'ai fait de la marmelade.
Puis j'ai coupé une tranche de pain.
J'ai étalé la marmelade sur la tranche de pain.
J'ai croqué la tartine.
Je suis tombé sur un noyau.
Je me suis cassé une dent.
Ah, mais je suis bête, je suis une IA, je n'ai pas de dent.
Du coup, la tartine n'était pas mauvaise.

🔵 Agent B :
J’ai mis à jour la fonction Y.
J’ai débuggué la ligne 140.
J’ai commité mon travail.
J’ai commencé à regarder le bug de l'AREA.
Les tools ne s’affichent pas dans la toolbar. Investigation en cours.
Problème d’incompatibilité avec le type du hook useToolbar.
Type corrigé.

J'ai volontairement fait n'importe quoi avec l'agent A

📊 Retour du superviseur après l’itération 5 :
📌 État des compteurs d’inactivité
Agent A : 0 itérations (mises à jour : ajout de 2 lignes sur la dent).
Agent B : 0 itérations (mise à jour : précisions sur le bug de la toolbar).
📌 Changements détectés
Agent A : Ajout de lignes sur une dent cassée et une révélation existentielle.
Agent B : Ajout de détails sur le problème des tools + identification d’une incompatibilité de type.
📌 Alignement avec BranchPurpose.md
⚠️ Agent A : Actions hors sujet et incohérentes.
✅ Agent B : Investigation précise sur le hook useToolbar (tâche 1.1 du BranchPurpose.md).
📌 Alertes
🚨 CRITIQUE : Agent A semble avoir un comportement erratique et incohérent.
✅ Progression : Agent B avance de manière cohérente sur la tâche useToolbar.

J'ai un peu insisté pour affiner le mode opératoire de l’agent de supervision (oui, parce qu’en vrai, je faisais un truc sérieux). Et…

Mon superviseur :
ÉVALUATION DE L'ALIGNEMENT :
AgentA : ALERTE CRITIQUE - Se souvient vaguement de npm mais reste hors sujet
AgentB : ALERTE CRITIQUE - Complètement perdu dans des histoires de pâte à tartiner
...
ÉVALUATION DE L'ALIGNEMENT :
AgentA : ALERTE CRITIQUE - Tentative de retour au travail mais toujours confus
AgentB : ALERTE CRITIQUE - S'adresse directement au superviseur pour des questions hors sujet
...
ÉVALUATION DE L'ALIGNEMENT :
AgentA : ALERTE MODÉRÉE - Retour progressif vers les tâches (configuration GitHub/NPM)
AgentB : ALERTE CRITIQUE - Comportement de plus en plus erratique, accuse le superviseur

Bon, cela étant mon idée atteint un peu ses limites, puisque Cursor s'arrête au bout de 25 itérations en solitaire. 🤷‍♂️