Fondamentaux

Token & context window

Unité de base utilisée par les LLMs (un token ≈ 4 caractères) et taille max gérable.

Un token est l’unité de base avec laquelle un LLM traite le texte. Comprendre cette notion est crucial pour maîtriser les coûts et les limites des modèles IA en entreprise.

Qu’est-ce qu’un token

1 token ≈ 4 caractères en anglais, ~3 en français (la langue est plus dense). Une phrase de 20 mots fait environ 30-40 tokens. Un email moyen : ~150 tokens. Un article de blog de 1000 mots : ~1500 tokens.

Le context window

Le context window est la quantité maximale de tokens qu’un modèle peut traiter en une fois (prompt + réponse). En 2026 : GPT-5 = 256k tokens, Claude 4 = 1M tokens, Mistral Large 2 = 128k tokens. C’est-à-dire jusqu’à plusieurs centaines de pages.

Pourquoi ça compte

Les LLMs sont facturés au token. Un long prompt = plus cher. Si votre cas d’usage demande beaucoup de contexte (RAG sur gros doc, analyse de plusieurs pages), vérifiez la limite et le coût avant de scaler.

Exemple concret

Un agent IA qui analyse un contrat de 50 pages : ~25 000 tokens de prompt + 2 000 tokens de réponse. Coût avec Claude 4 Opus : ~0,40€ par analyse.

À retenir

Comprendre les tokens et le context window est essentiel dès qu’on industrialise un usage IA. C’est la clé du contrôle des coûts.

Aller plus loin

Mettre Token
en pratique chez vous.

Demander un audit