Passer au contenu principal

​​🧠​ GĂ©rer la mĂ©moire de conversation : un levier de frugalitĂ© souvent nĂ©gligĂ©

Écrit par Nicolas Movio
Mis Ă  jour cette semaine

L’impact de la mĂ©moire

À chaque nouveau message dans une conversation, l'assistant IA recharge tout l'historique pour maintenir le contexte.

ConcrĂštement :

  • 1er message : 100k tokens consommĂ©s

  • 2e message : 100k (historique) + 100k (nouveau) = 200k tokens

  • 3e message : 200k (historique) + 100k (nouveau) = 300k tokens

👉 Plus la conversation s'allonge, plus chaque nouvelle interaction coĂ»te cher en ressources, mĂȘme si le message lui-mĂȘme est court.

Le problĂšme : si ce contexte n'est plus utile pour votre nouvelle demande, vous payez (indirectement) le coĂ»t de cette mĂ©moire sans en tirer aucun bĂ©nĂ©fice, tout en ralentissant les Ă©changes (moins de performance), en consommant davantage de tokens (coĂ»t indirect), et en augmentant l’empreinte Ă©cologique (Ă©nergie, mais aussi eau utilisĂ©e pour le refroidissement des infrastructures). L’objectif : ĂȘtre plus frugal — cf. l’article L’IA, mieux plutĂŽt que plus : adopter une approche frugale.

đŸ§© Petit rappel : mĂ©moire + tokens

Un assistant basĂ© sur un LLM ne “se souvient” pas au sens humain : il relit Ă  chaque message une partie (ou tout) de l’historique de la conversation, dans la limite de sa fenĂȘtre de contexte. Cette fenĂȘtre se mesure en tokens (unitĂ©s de texte).

👉 Pour une explication simple et des ordres de grandeur, voir : Les limites des LLM et la notion de tokens.


Quand garder la mĂȘme conversation ?

Il est pertinent de poursuivre la mĂȘme conversation lorsque :

  • vous itĂ©rez sur un mĂȘme document ou sujet

  • vous affinez progressivement une rĂ©ponse

  • vous posez des questions complĂ©mentaires liĂ©es au contexte prĂ©cĂ©dent

  • vous demandez des ajustements de format ou de contenu

Exemple :

  1. "Résume ce rapport en 5 points clés"

  2. "Ajoute une recommandation pour chaque point"

  3. "Mets tout ça sous forme de tableau"

Ici, chaque message s'appuie sur le précédent : la mémoire est utile et justifie son coût.


Quand ouvrir une nouvelle conversation ?

Il est préférable de démarrer une nouvelle conversation dÚs que :

  • vous changez complĂštement de sujet

  • vous passez Ă  un nouveau document sans lien avec le prĂ©cĂ©dent

  • vous avez fini une tĂąche et passez Ă  autre chose

  • la conversation devient longue et le contexte initial n'est plus pertinent

Exemple :

Conversation 1 : analyse d'un document marketing → TerminĂ© ✓

Nouvelle conversation : rédaction d'un email client

👉 Aucun lien entre les deux sujets → aucune raison de conserver l'historique de la premiùre conversation.


Le réflexe à adopter

Posez-vous cette question simple avant de continuer une conversation :

"Est-ce que l'IA a besoin de se souvenir de ce qui précÚde pour répondre correctement ?"

  • Oui → continuez dans la mĂȘme conversation

  • Non → ouvrez-en une nouvelle

Ce geste simple peut diviser par 2 ou 3 la consommation de tokens (et donc d’énergie utilisĂ©e) sur une journĂ©e d'utilisation, tout en maintenant la mĂȘme qualitĂ© de rĂ©ponses.


En résumé

Situation

Action recommandée

ItĂ©ration sur un mĂȘme sujet

Garder la conversation

Affinage d'une réponse

Garder la conversation

Changement de sujet

Nouvelle conversation

Conversation longue et contexte dépassé

Nouvelle conversation

Document différent sans lien

Nouvelle conversation

👉 GĂ©rer activement ses conversations, c'est Ă©viter de payer pour une mĂ©moire devenue inutile.

C'est un levier simple, immédiat, et trÚs efficace pour adopter une approche plus frugale au quotidien.

Avez-vous trouvé la réponse à votre question ?