Lâimpact de la mĂ©moire
Ă chaque nouveau message dans une conversation, l'assistant IA recharge tout l'historique pour maintenir le contexte.
ConcrĂštement :
1er message : 100k tokens consommés
2e message : 100k (historique) + 100k (nouveau) = 200k tokens
3e message : 200k (historique) + 100k (nouveau) = 300k tokens
đ Plus la conversation s'allonge, plus chaque nouvelle interaction coĂ»te cher en ressources, mĂȘme si le message lui-mĂȘme est court.
Le problĂšme : si ce contexte n'est plus utile pour votre nouvelle demande, vous payez (indirectement) le coĂ»t de cette mĂ©moire sans en tirer aucun bĂ©nĂ©fice, tout en ralentissant les Ă©changes (moins de performance), en consommant davantage de tokens (coĂ»t indirect), et en augmentant lâempreinte Ă©cologique (Ă©nergie, mais aussi eau utilisĂ©e pour le refroidissement des infrastructures). Lâobjectif : ĂȘtre plus frugal â cf. lâarticle LâIA, mieux plutĂŽt que plus : adopter une approche frugale.
𧩠Petit rappel : mémoire + tokens
Un assistant basĂ© sur un LLM ne âse souvientâ pas au sens humain : il relit Ă chaque message une partie (ou tout) de lâhistorique de la conversation, dans la limite de sa fenĂȘtre de contexte. Cette fenĂȘtre se mesure en tokens (unitĂ©s de texte).
đ Pour une explication simple et des ordres de grandeur, voir : Les limites des LLM et la notion de tokens.
Quand garder la mĂȘme conversation ?
Il est pertinent de poursuivre la mĂȘme conversation lorsque :
vous itĂ©rez sur un mĂȘme document ou sujet
vous affinez progressivement une réponse
vous posez des questions complémentaires liées au contexte précédent
vous demandez des ajustements de format ou de contenu
Exemple :
"Résume ce rapport en 5 points clés"
"Ajoute une recommandation pour chaque point"
"Mets tout ça sous forme de tableau"
Ici, chaque message s'appuie sur le précédent : la mémoire est utile et justifie son coût.
Quand ouvrir une nouvelle conversation ?
Il est préférable de démarrer une nouvelle conversation dÚs que :
vous changez complĂštement de sujet
vous passez à un nouveau document sans lien avec le précédent
vous avez fini une tĂąche et passez Ă autre chose
la conversation devient longue et le contexte initial n'est plus pertinent
Exemple :
Conversation 1 : analyse d'un document marketing â TerminĂ© â
Nouvelle conversation : rédaction d'un email client
đ Aucun lien entre les deux sujets â aucune raison de conserver l'historique de la premiĂšre conversation.
Le réflexe à adopter
Posez-vous cette question simple avant de continuer une conversation :
"Est-ce que l'IA a besoin de se souvenir de ce qui précÚde pour répondre correctement ?"
Oui â continuez dans la mĂȘme conversation
Non â ouvrez-en une nouvelle
Ce geste simple peut diviser par 2 ou 3 la consommation de tokens (et donc dâĂ©nergie utilisĂ©e) sur une journĂ©e d'utilisation, tout en maintenant la mĂȘme qualitĂ© de rĂ©ponses.
En résumé
Situation | Action recommandée |
ItĂ©ration sur un mĂȘme sujet | Garder la conversation |
Affinage d'une réponse | Garder la conversation |
Changement de sujet | Nouvelle conversation |
Conversation longue et contexte dépassé | Nouvelle conversation |
Document différent sans lien | Nouvelle conversation |
đ GĂ©rer activement ses conversations, c'est Ă©viter de payer pour une mĂ©moire devenue inutile.
C'est un levier simple, immédiat, et trÚs efficace pour adopter une approche plus frugale au quotidien.
