lundi 13 avril 2026← Tous les articles

Vous avez sûrement remarqué : au bout d'une longue conversation, l'IA se met à oublier ce que vous lui avez dit au début. Ce n'est pas un bug, c'est une question de « mémoire de travail ». Voici, sans jargon, pourquoi ça arrive et comment on l'évite.

Un token, c'est quoi ? Un petit morceau de mot

Une IA ne lit pas les mots comme nous. Elle les découpe en tokens, c'est-à-dire en petits morceaux. Un token, c'est environ trois quarts d'un mot en français.

Par exemple, le mot « auto-entrepreneur » peut se découper en plusieurs tokens : « auto », « entre », « preneur ». Une phrase courte fait quelques tokens ; un long e-mail en fait des centaines.

Pourquoi c'est utile à savoir ? Parce que tout ce que l'IA lit et écrit se compte en tokens. Plus il y a de texte, plus il y a de tokens à traiter. Et c'est là que la limite apparaît.

La fenêtre de contexte : un bureau de taille limitée

Imaginez le bureau d'une personne très efficace. Tant que les documents tiennent sur le bureau, elle voit tout d'un coup d'œil et répond vite. Mais le bureau a une taille fixe. Quand il est plein, pour poser une nouvelle feuille, il faut en retirer une ancienne.

C'est exactement la fenêtre de contexte : la quantité de texte que l'IA peut garder « sous les yeux » en même temps. Une fois cette fenêtre pleine :

les premières informations de la conversation glissent hors du bureau ;
l'IA ne les « voit » plus, donc elle les oublie ;
elle peut alors se contredire ou redemander une chose déjà dite.

L'IA n'oublie pas par paresse. Elle oublie parce que son bureau est plein.

C'est pour ça qu'une discussion fleuve part parfois en vrille : votre brief du départ a disparu sous une pile de messages plus récents.

Pourquoi ré-expliquer à chaque fois est épuisant

Avec un simple assistant conversationnel, tout vit dans la conversation. Votre activité, vos tarifs, le ton de vos e-mails, le nom de vos clients : si ce n'est pas dans la fenêtre, ça n'existe pas pour l'IA.

Résultat, vous repartez de zéro à chaque nouvelle discussion. Vous recollez les mêmes informations, encore et encore. Au-delà de la perte de temps, c'est frustrant : vous avez l'impression de former quelqu'un qui ne retient rien.

Comment chyll garde le fil

chyll est une agence qui construit des systèmes d'IA sur-mesure. Nous construisons pour vous un système câblé à vos outils, et il sépare deux choses qu'un chatbot mélange : la conversation du moment et le contexte durable de votre entreprise.

Ce contexte (votre activité, vos offres, votre façon de parler) est appris une seule fois, puis rangé à part dans la mémoire d'entreprise. Il n'encombre pas le bureau : il est ressorti au bon moment, quand chyll en a besoin.

Concrètement, cela change tout :

vous n'avez plus à réexpliquer votre boîte à chaque fois ;
toutes vos tâches (un devis, une relance, un brouillon de réponse client) s'appuient sur la même mémoire d'entreprise ;
une longue tâche ne fait plus « tomber » vos infos importantes hors de la fenêtre.

L'IA reste limitée par sa fenêtre, comme toutes les IA. La différence, c'est l'organisation autour : on ne demande pas au bureau de tout porter. On garde l'essentiel dans un classeur fiable, et on ne pose sur le bureau que ce qui sert maintenant.

Un dernier réflexe utile, même hors de chyll : pour une tâche précise, ouvrez une nouvelle conversation plutôt que de prolonger un fil interminable. Un bureau vide travaille toujours mieux qu'un bureau saturé.

Envie d'un système qui garde le fil de votre activité sans que vous ayez à tout réexpliquer ? Réservez un appel : on conçoit le vôtre, livré en deux à trois semaines.

Tokens, fenêtre de contexte : pourquoi l'IA « oublie » parfois

Un token, c'est quoi ? Un petit morceau de mot

La fenêtre de contexte : un bureau de taille limitée

Pourquoi ré-expliquer à chaque fois est épuisant

Comment chyll garde le fil

On construit l'agent IA qui fait tourner votre boîte.

Ce qui a changé en IA ce mois-ci (et ce que ça change pour vous)

L'IA qui vous montre avant d'envoyer : pourquoi on garde la main