Token (jeton)

La plus petite unité de texte qu'un modèle de langage traite (souvent un fragment de mot, pas un mot entier).

Un token est l’unité en laquelle le texte est découpé avant qu’un LLM ne le traite. Les tokens sont souvent des fragments sous-mot plutôt que des mots entiers.

Le nombre de tokens compte pour le coût, la latence et les limites de la fenêtre de contexte. Quand on dit « ce prompt est long », on veut généralement dire « il contient beaucoup de tokens ».