Un token est l’unité de base avec laquelle un LLM traite le texte. Comprendre cette notion est crucial pour maîtriser les coûts et les limites des modèles IA en entreprise.
Qu’est-ce qu’un token
1 token ≈ 4 caractères en anglais, ~3 en français (la langue est plus dense). Une phrase de 20 mots fait environ 30-40 tokens. Un email moyen : ~150 tokens. Un article de blog de 1000 mots : ~1500 tokens.
Le context window
Le context window est la quantité maximale de tokens qu’un modèle peut traiter en une fois (prompt + réponse). En 2026 : GPT-5 = 256k tokens, Claude 4 = 1M tokens, Mistral Large 2 = 128k tokens. C’est-à-dire jusqu’à plusieurs centaines de pages.
Pourquoi ça compte
Les LLMs sont facturés au token. Un long prompt = plus cher. Si votre cas d’usage demande beaucoup de contexte (RAG sur gros doc, analyse de plusieurs pages), vérifiez la limite et le coût avant de scaler.
Exemple concret
Un agent IA qui analyse un contrat de 50 pages : ~25 000 tokens de prompt + 2 000 tokens de réponse. Coût avec Claude 4 Opus : ~0,40€ par analyse.
À retenir
Comprendre les tokens et le context window est essentiel dès qu’on industrialise un usage IA. C’est la clé du contrôle des coûts.