Vous avez sûrement remarqué : au bout d'une longue conversation, l'IA se met à oublier ce que vous lui avez dit au début. Ce n'est pas un bug, c'est une question de « mémoire de travail ». Voici, sans jargon, pourquoi ça arrive et comment on l'évite.
Un token, c'est quoi ? Un petit morceau de mot
Une IA ne lit pas les mots comme nous. Elle les découpe en tokens, c'est-à-dire en petits morceaux. Un token, c'est environ trois quarts d'un mot en français.
Par exemple, le mot « auto-entrepreneur » peut se découper en plusieurs tokens : « auto », « entre », « preneur ». Une phrase courte fait quelques tokens ; un long e-mail en fait des centaines.
Pourquoi c'est utile à savoir ? Parce que tout ce que l'IA lit et écrit se compte en tokens. Plus il y a de texte, plus il y a de tokens à traiter. Et c'est là que la limite apparaît.
La fenêtre de contexte : un bureau de taille limitée
Imaginez le bureau d'une personne très efficace. Tant que les documents tiennent sur le bureau, elle voit tout d'un coup d'œil et répond vite. Mais le bureau a une taille fixe. Quand il est plein, pour poser une nouvelle feuille, il faut en retirer une ancienne.
C'est exactement la fenêtre de contexte : la quantité de texte que l'IA peut garder « sous les yeux » en même temps. Une fois cette fenêtre pleine :
- les premières informations de la conversation glissent hors du bureau ;
- l'IA ne les « voit » plus, donc elle les oublie ;
- elle peut alors se contredire ou redemander une chose déjà dite.
L'IA n'oublie pas par paresse. Elle oublie parce que son bureau est plein.
C'est pour ça qu'une discussion fleuve part parfois en vrille : votre brief du départ a disparu sous une pile de messages plus récents.
Pourquoi ré-expliquer à chaque fois est épuisant
Avec un simple assistant conversationnel, tout vit dans la conversation. Votre activité, vos tarifs, le ton de vos e-mails, le nom de vos clients : si ce n'est pas dans la fenêtre, ça n'existe pas pour l'IA.
Résultat, vous repartez de zéro à chaque nouvelle discussion. Vous recollez les mêmes informations, encore et encore. Au-delà de la perte de temps, c'est frustrant : vous avez l'impression de former quelqu'un qui ne retient rien.
Comment chyll garde le fil
chyll sépare deux choses qu'un chatbot mélange : la conversation du moment et le contexte durable de votre entreprise.
Ce contexte (votre activité, vos offres, votre façon de parler) est appris une seule fois, puis rangé à part. Il n'encombre pas le bureau : il est ressorti au bon moment, quand un agent en a besoin.
Concrètement, cela change tout :
- vous n'avez plus à réexpliquer votre boîte à chaque fois ;
- tous vos agents (Diana la commerciale, Léo le marketeur, Manon au support) partagent la même mémoire d'entreprise ;
- une longue tâche ne fait plus « tomber » vos infos importantes hors de la fenêtre.
L'IA reste limitée par sa fenêtre, comme toutes les IA. La différence, c'est l'organisation autour : on ne demande pas au bureau de tout porter. On garde l'essentiel dans un classeur fiable, et on ne pose sur le bureau que ce qui sert maintenant.
Un dernier réflexe utile, même hors de chyll : pour une tâche précise, ouvrez une nouvelle conversation plutôt que de prolonger un fil interminable. Un bureau vide travaille toujours mieux qu'un bureau saturé.