Annonce d'Anthropic

Si vous aussi vous trouvez que vos tokens partent un peu vite. Anthropic a une bonne nouvelle à vous annoncer !
Je dois l'admettre, j'ai beau apprécier Claude et l'utiliser depuis plus d'un an, je suis tout de même déçu par ses prestations ces derniers temps.
Beaucoup de devs relèvent son côté de plus en plus lazy et je suis plutôt d'accord. On a l'impression qu'il a tendance à bâcler le travail ces derniers temps.
Il va moins loin dans l'analyse, livre à l'arrache sans tester, fait des erreurs stupides... La liste est longue.
Mais dans les faits il n'est pas plus "lazy" mais limité en compute, tout simplement.
Anthropic fait face à une montée en charge et n'a pas chercher à démentir ce phénomène. Ils ont juste dis que c'était de plus en plus compliqué pour eux de fournir du compute à tout le monde.
Traduction: On est obligé de limiter le compute time pour pouvoir share le maximum de ressources...
Et en tant qu'utilisateur, ça se traduit par plusieurs phénomènes:
- une accélération de la consommation de token
- une réponse donnée très très vite, sans même avoir vérifier si ça marchait
Mais Anthropic fait une annonce sur X
Ce matin même, le 7 mai 2026, sur X, Anthropic publie une annonce:
On va prochainement augmenter la puissance de calcul et étendre les limites d'usage (consommation de tokens) grâce à un partenariat avec SpaceX.
Et le changement est assez radical:
Les limites passent:
- de 30k à 500k par minute en input
- de 8k à 80k par minute en output
D'après un blogpost, ils annoncent récupérer un datacenter Colossus 1 d'une puissance de 300 megawatts (plus de 220k GPU Nvidia). Et tout cela, dès ce mois-ci !
Bref, ça s'annonce fou, mais pour le moment ce n'est pas encore déployé... Un peu de patience !
Sortez les RTK en attendant pour réduire la consommation de tokens.
Update
J'ai vu un blogpost sur le blog d'Anthropic annonce le double des limites d'usage pour les forfait Pro et Max avec cette annonce.
Hâte que ce soit mis en place du coup !
FAQ
Pourquoi Claude semble-t-il moins performant ces derniers temps ?
Ce n'est pas une régression du modèle en lui-même, mais une contrainte de ressources de calcul. Face à une montée en charge, Anthropic a dû limiter le compute alloué par requête, ce qui se traduit par des réponses moins approfondies et une consommation de tokens accélérée.
Concrètement, qu'est-ce qui va changer avec cette annonce ?
Les limites de tokens passent de 30k à 500k par minute en entrée, et de 8k à 80k par minute en sortie. Les abonnés Pro et Max bénéficieraient en plus d'un doublement de leurs limites d'usage habituelles.
Quand ces améliorations seront-elles disponibles ?
Anthropic parle d'un déploiement dès ce mois de mai 2025, mais au moment de la publication de l'article ce n'est pas encore effectif. Il faudra donc patienter encore un peu.
Que faire en attendant pour limiter ma consommation de tokens ?
L'article conseille d'utiliser des RTK (réduction de tokens) pour optimiser vos échanges avec Claude le temps que les nouvelles capacités soient déployées.

Alexandre P.
Développeur passionné depuis plus de 20 ans, j'ai une appétence particulière pour les défis techniques et changer de technologie ne me fait pas froid aux yeux.
Poursuivre la lecture


