2.1 Comment faire des requêtes efficaces pour avoir de meilleurs résultats ?

Qu'est-ce qu'une requête ?

Qu'elle est l'importance des jetons (tokens) ?

Définition des jetons

Dans le contexte de l'IA et du traitement du langage naturel (NLP), un jeton (ou token en anglais) est une unité de texte traitée par le modèle d'IA. Les jetons peuvent être des mots, des parties de mots ou même des caractères individuels, selon le modèle d'IA utilisé.

Fonctionnement des jetons

Lorsque vous fournissez une requête à une IA, le texte est d'abord décomposé en une série de jetons. Voici les étapes principales du traitement des jetons :

Analyse de la requête : L'IA reçoit la requête et commence par le diviser en jetons. Par exemple, la phrase « Bonjour, comment ça va ? » peut être décomposée en jetons individuels comme [« Bonjour », « , », « comment », « ça », « va », « ? »].
Traitement des jetons : L'IA utilise des techniques de traitement du langage naturel pour analyser ces jetons, identifier les relations entre eux, et comprendre le contexte.
Génération de la réponse : Une fois que le modèle a compris la requête, il génère une réponse en utilisant une série de jetons qui sont ensuite recomposés en texte lisible pour l'utilisateur.

Importance des jetons

Les jetons sont essentiels car ils sont la base du fonctionnement des modèles de langage. La qualité et l'efficacité des réponses générées par l'IA dépendent en grande partie de la façon dont les jetons sont traités. Plus les instructions fournies sont claires et bien structurées, meilleure sera la qualité des jetons produits et donc des réponses générées.

Pourquoi est-ce important ?

Le modèle GPT-4 de ChatGPT est limité à environ 8 000 jetons par conversation, bien que cette limite puisse varier en fonction de la version spécifique utilisée. Ces jetons incluent à la fois les requêtes et les réponses dans l'échange. Pour les versions avec des capacités plus étendues, comme GPT-4-32k, la limite peut atteindre jusqu'à 32 000 jetons.

Comprendre cette limitation est essentiel pour gérer efficacement les interactions longues ou complexes avec l'IA. Lorsqu'une conversation s'approche de cette limite, il peut être nécessaire de redémarrer une nouvelle conversation afin d'éviter toute perte de contexte ou de performance dans les réponses générées. Cela permet de maintenir une interaction fluide et précise, sans dépasser les contraintes de jetons imposés par le modèle.

Qu'est-ce que ça représente ?

En général, un jeton correspond à environ 3/4 d'un mot. Cela peut varier en fonction de la langue et de la complexité des mots utilisés. Pour donner une estimation, 8 000 jetons représentent environ 6 000 mots. Voici comment cette estimation est faite :

1 jeton ≈ 0.75 mot
8 000 jetons ≈ 8 000 * 0.75 mots
8 000 jetons ≈ 6 000 mots

Cette estimation peut varier en fonction du texte et du modèle de langage utilisé, car certains jetons peuvent représenter des caractères individuels, des parties de mots ou des symboles. Pour obtenir une meilleure idée du nombre de jetons utilisés, vous pouvez utiliser le Tokenizer de ChatGPT.