Utiliser Claude sans gaspiller vos crédits
Guide pratique pour optimiser votre abonnement Claude Pro
Bonjour à toutes et à tous !
Nous sommes maintenant plus de 6 570. Merci à vous 🙏
Si ce n’est pas déjà fait, vous pouvez aussi :
Rejoindre ma communauté Premium en passant à l’abonnement payant.
Gagner en visibilité en sponsorisant cette newsletter.
Découvrir mes formations IA.
J’ai plusieurs abonnements payants : ChatGPT Business, Gemini Pro, Perplexity Pro, Copilot 365 et Claude Pro.
Sur tous ces outils, c’est Claude qui m’épuise le plus vite et c’est celui que j’utilise le plus, notamment pour mon activité de formatrice.
La semaine dernière encore, j’étais en plein milieu de la préparation d’un atelier pour ma formation IA. Slides à construire, cas pratiques à rédiger, exercices à calibrer selon le niveau des participants. Et à mi-parcours : limite Claude atteinte. Plus qu’à attendre la réinitialisation de la session ou basculer sur un autre outil pour finir.
Ce n’est pas la première fois, mais cette fois-là j’ai décidé de comprendre pourquoi ça arrive si vite et ce qu’on peut faire avant de passer à Max, qui coûte entre 100 et 200 dollars par mois.
J’ai commencé par la lecture de la documentation de Claude sur les bonnes pratiques pour limiter les utilisations de crédits.
Puis j’ai regardé d’autres sources, testé et comparé.
Je vous partage aujourd’hui ce que j’ai découvert.
D’abord, comprendre comment Claude compte
Claude ne compte pas des messages. Il compte des tokens.
Un token, c’est environ 4 caractères ou ¾ d’un mot.
Votre question, la réponse de Claude, tout l’historique de la conversation, les fichiers uploadés, les outils activés, la mémoire chargée au démarrage : tout ça, c’est des tokens.
Et voici le point que la plupart des gens ignorent : à chaque nouveau message, Claude relit tout l’historique depuis le début.
Tout, message par message !
Une conversation de 30 échanges coûte donc beaucoup plus qu’une conversation de 5 échanges, même si vos questions sont courtes.
Sur le plan Pro (20 $/mois), vous avez une fenêtre de 5 heures.
Le compteur repart à zéro automatiquement. Il y a aussi une limite hebdomadaire.
Les deux sont visibles dans Paramètres → Utilisation : vous voyez en temps réel votre session en cours et votre quota de la semaine.
D’ailleurs, en ouvrant mon onglet Utilisation cette semaine, j’ai trouvé ça :
Un crédit gratuit à réclamer directement dans l’interface.
Pourquoi Anthropic propose ce crédit ? La réponse est liée à l’actualité récente.
Le 4 avril 2026 Anthropic a bloqué l’accès des abonnements Pro et Max aux outils tiers comme OpenClaw, estimant qu’ils généraient une charge disproportionnée sur ses serveurs. Pour adoucir la transition, la société a offert un crédit ponctuel aux utilisateurs.
Ça vaut le coup de vérifier. Certains crédits peuvent aussi apparaître pour d’autres raisons, comme des promotions ponctuelles ou des gestes commerciaux.
Allez dans Paramètres → Utilisation et regardez si vous avez une bannière similaire. Si oui, réclamez-la avant le 17 avril.
Ce qui consomme des tokens sans que vous le sachiez
1. Les PDF sont les fichiers les plus gourmands
Quand vous uploadez un PDF, Claude ne lit pas juste le texte. Il extrait le texte ET convertit chaque page en image. Vous payez les deux.
Un document de 50 pages peut consommer entre 75 000 et 150 000 tokens rien que par sa présence dans la conversation. La fenêtre de contexte de Claude est de 200 000 tokens. Un seul PDF peut donc occuper les trois quarts de votre espace de travail.
Et c’est valable pour chaque message suivant. Parce que Claude relit tout à chaque échange, ce PDF pèse sur chaque question que vous posez.
L’astuce que j’utilise maintenant : j’uploade le PDF, je demande à Claude de le convertir en texte brut, je copie ce texte, j’ouvre une nouvelle conversation et je colle le texte. Le coût est réduit de plus de moitié pour tous les échanges suivants.
Les fichiers Word, PowerPoint et Excel posent le même problème. Claude doit d’abord lire les éléments de mise en forme avant d’accéder au contenu.
Pour un tableau, un export en CSV suffit. Pour un document, du texte brut suffit.
Je sais, ça fait une manipulation en plus. Mais sur une session de travail d’une heure avec un contrat de 80 pages, la différence est considérable.
2. Les outils activés chargent des tokens à vide
Chaque connecteur actif (Google Drive, Slack, recherche web, les MCP) injecte sa définition complète dans le contexte de chaque message.
Que vous l’utilisiez ou non pendant cet échange.
Quelques connecteurs actifs peuvent consommer plus de 10 000 tokens avant même votre première question. Avec cinq ou six connecteurs, vous donnez une part significative de votre fenêtre à des outils dont vous n’avez pas besoin là maintenant.
Ce que je fais : je coupe la recherche web dans le menu "Search and tools" quand je n'en ai pas besoin.
Pour les connecteurs (Drive, Slack, Gamma, Canva...), je déconnecte ceux que je n'utilise pas régulièrement dans Paramètres → Connecteurs. C'est tout-ou-rien pour le moment, mais ça allège chaque session.
3. La mémoire de Claude coûte aussi des tokens
Depuis début 2026, Claude mémorise des informations entre les conversations. Ces souvenirs sont chargés dans le contexte au démarrage de chaque session. C’est invisible, automatique et cumulatif.
Si Claude a mémorisé des dizaines d’informations sur vous (certaines anciennes, certaines inutiles), elles consomment des tokens à chaque nouvelle conversation, même si vous ne les avez jamais demandées.
Exemple : Claude avait gardé en mémoire que j’étais allée à Annecy en mars 2026. Cette info ne m’était pas utile ici, je l’ai supprimée.
Vous pouvez gérer la mémoire dans Paramètres → Capacités → Mémoire.
Je vous recommande de faire le tri de temps en temps. Supprimer ce qui n’est plus pertinent, c’est aussi économiser des tokens.
4. L’usage est partagé entre TOUS les produits Claude
Votre quota est le même que vous utilisiez Claude sur le web, l’application mobile, Claude Desktop, Claude Code, Cowork ou les intégrations Excel et PowerPoint. Tout tape dans le même compteur.
Si vous avez passé la matinée sur Claude Code pour du développement, votre session Claude web l’après-midi sera plus courte. Et inversement. C’est un pot commun.
Les habitudes qui font la différence
⏩ Modifier son message plutôt que répondre
C’est probablement l’astuce la moins connue et la plus puissante sur les sessions longues.
Quand la réponse de Claude ne vous convient pas, le réflexe naturel est d’envoyer un nouveau message pour corriger.
Mais ce nouveau message s’ajoute à l’historique. Claude relit tout depuis le début, y compris votre correction et l’ancienne réponse.
Si vous modifiez le message d’origine à la place (le crayon d’édition est disponible sur chaque message envoyé) et que vous relancez, l’ancienne réponse est remplacée. Rien ne s’accumule.
Sur une session où vous faites 10 allers-retours de correction, la différence en tokens est considérable.
J’ai fait le test sur une rédaction de clause contractuelle la semaine dernière : 10 corrections par nouveau message vs 10 corrections par modification.
La première approche a consommé presque trois fois plus.
⏩ Commencer une nouvelle conversation au bon moment
Chaque message que vous envoyez transmet l’intégralité de l’historique. Message 1, message 2, message 3... tout est relu à chaque fois.
À partir d’une certaine longueur, continuer dans la même conversation coûte plus cher que de repartir.
Le bon moment pour repartir : quand vous changez de sujet, de tâche ou de phase dans un projet.
La technique que j’utilise : avant de fermer une longue conversation, je demande à Claude un résumé condensé de ce qu’on a vu ensemble et du contexte qui compte. Je colle ce résumé en début de nouvelle conversation. Le fil est préservé, le compteur repart léger.
D’ailleurs, depuis quelques semaines, Claude gère automatiquement les conversations trop longues en résumant les messages anciens.
C’est bien, mais c’est mieux de le faire vous-même et au bon moment pour garder le contrôle sur ce qui est conservé.
⏩ Dire à Claude combien vous voulez
Vous avez probablement déjà remarqué : par défaut Claude est bavard.
Il explique, il contextualise, il résume ce qu’il vient de faire.
Et parfois c’est utile, mais pas pour chaque conversation.
Dire explicitement ce que vous attendez réduit le volume des réponses. Et donc les tokens qui s’accumulent dans l’historique pour les échanges suivants.
Quelques formulations qui fonctionnent :
“Réponds en 3 lignes maximum.”
“Donne-moi uniquement la liste, sans introduction.”
“Retourne juste le document modifié, sans commentaire.”
“Une phrase suffit.”
Et ça coupe souvent les tokens de réponse de moitié.
⏩ Utiliser les Styles pour ne pas répéter vos instructions
Claude permet de créer des Styles personnalisés dans les réglages.
Un style, c’est un ensemble d’instructions que Claude applique automatiquement : ton, format, longueur, langue...
Sans style, vous répétez à chaque conversation : “Sois concis, en français, avec un ton professionnel, pas de bullet points inutiles.”
Ça fait des tokens à chaque fois.
Avec un style enregistré, ces instructions sont chargées une seule fois.
Vous gagnez des tokens et de la cohérence.
⏩ Choisir le bon modèle
J’en ai déjà parlé dans la première édition sur Claude.
Claude propose trois modèles : Haiku, Sonnet et Opus.
Une conversation identique (mêmes questions, mêmes longueurs) épuise vos crédits 5 fois plus vite sur Opus que sur Haiku.
Ma stratégie depuis que je teste ça : je commence sur Haiku. Quand la réponse me semble insuffisante en profondeur ou en nuance, je passe sur Sonnet pour cette tâche précise. J’utilise Opus pour un nombre limité de cas vraiment exigeants.
Ça demande un petit changement d’habitude, mais la différence sur le quota hebdomadaire est nette.
⏩ Utiliser les Projets intelligemment
Les Projets Claude ont un vrai avantage pour les documents de référence. Les fichiers ajoutés sont mis en cache.
Après la première lecture, ils coûtent beaucoup moins de tokens dans les échanges suivants.
Si vous utilisez souvent les mêmes documents, comme une charte, un contrat type ou une base de connaissances, mieux vaut les ajouter dans un Projet plutôt que de les envoyer à chaque fois.
Les instructions du Projet fonctionnent pareil.
Gardez-les courtes. L’idée est de donner le bon contexte, pas d’écrire un mode d’emploi complet. Des instructions trop longues consomment des tokens à chaque échange.
⏩ Le facteur horaire : travailler avec le système
Claude fonctionne avec des sessions de 5 heures.
Mais depuis fin mars 2026, Anthropic a confirmé que les limites de session sont atteintes plus vite pendant les heures de pointe.
Les heures de pointe : 8h-14h heure de New York, soit 14h-20h en France en semaine.
Conséquence pratique : les tâches lourdes en tokens (analyser un long document, faire une session intensive, générer du contenu en volume) sont plus rentables le matin avant 14h heure française ou le soir après 20h. Et encore plus le week-end.
⏩ Désactiver le “Réflexion étendue” quand ce n’est pas utile
Depuis Claude 4.6, le mode de raisonnement est adaptatif. Claude décide lui-même s’il a besoin de “réfléchir en profondeur” avant de répondre.
Par défaut, l’effort est réglé sur “élevé”. Ce qui signifie que Claude active ce mode de réflexion approfondie presque à chaque réponse. Y compris pour reformuler un email ou résumer trois paragraphes.
Ce raisonnement étendu consomme beaucoup de tokens.
Vous pouvez le désactiver :
Pour une reformulation, une question factuelle, une mise en forme, un résumé court : coupez-le. Réactivez-le quand vous avez une vraie question complexe.
⏩ Les conversations incognito
Claude propose un mode Conversation incognito (accessible depuis le menu de nouvelle conversation).
Dans ce mode, Claude ne charge pas votre mémoire au démarrage. Et la conversation n’est pas sauvegardée dans l’historique.
Résultat : moins de tokens consommés au départ, puisque la mémoire n’est pas injectée.
Pour une question ponctuelle, une traduction rapide, un calcul, c’est le bon réflexe.
Et ça marche ?
J’ai commencé à appliquer ces habitudes avant de décider si je passais à Max.
Résultat : je touche encore mes limites, mais beaucoup moins souvent. Et quand ça arrive, c’est sur des sessions vraiment intensives, pas sur un usage normal.
Ce que j’ai réalisé en chemin : j’ai trouvé un meilleur équilibre entre tous mes abonnements. Chaque outil a ses forces et avec le temps ça devient assez intuitif.
Je sais quelle question aller poser à ChatGPT, j’utilise Gemini pour créer les visuels, je me tourne vers Perplexity pour la recherche et la veille.
Claude, lui, reste mon outil central pour pour mon usage perso et tout ce qui demande de la profondeur : analyser, rédiger, structurer une réflexion.
Bonus pour mes abonnés Premium 🎁
J’ai préparé un guide complet sur le sujet : tout ce que j’ai trouvé, testé et gardé pour ne plus gaspiller ses crédits Claude. Avec plusieurs astuces supplémentaires.
Vous le retrouverez dans notre Espace Premium sur Notion.
Si vous avez perdu le lien ou vous n’avez pas reçu le message de bienvenue, envoyez moi un MP, je vous renvoie l’accès dans la journée.
Et si vous n’avez pas encore franchi le pas pour devenir mon abonné Premium, c’est le bon moment !
Si vous voulez aller plus loin que cette newsletter
Cowork, les Skills, les Projets, les plugins... Chaque édition de cette série vous donne les clés pour démarrer. Mais je sais aussi que lire un guide et pratiquer au quotidien, ce sont deux choses très différentes.
Si vous me suivez depuis quelque temps, vous savez que j’ai lancé un Parcours IA en petit groupe pour juristes.
La première édition du Parcours vient de se terminer. Et elle a confirmé une chose : on apprend bien quand on prend le temps de pratiquer, d’échanger et de tester.
Pendant 2 mois, on a travaillé ensemble avec plusieurs juristes sur des cas concrets, construit des prompts utiles, créé des assistants. Chacun a trouvé sa manière d’utiliser l’IA dans son quotidien.
Je prépare une 2e édition qui va démarrer en mai. Même format : petit groupe, 2 mois, des sessions pratiques et un suivi entre les ateliers. Avec les ajustements tirés de cette première expérience.
Si ça vous intéresse, j’ai mis toutes les infos ici.
Et si cette newsletter vous est utile :
Cliquez sur le ❤ (en haut ou en bas).
Parlez-en autour de vous.
Et dites-moi en commentaire : vous avez déjà touché vos limites Claude ?
Qu’est-ce qui a marché pour vous ?
À très vite,
Daria










Fabuleuse nouvelle newsletter Daria !!
Essaie la conversion des fichiers texte en markdown (.md) pour gagner encore quelques tokens ;)
Merci pour toutes ces bonnes astuces