Deepseek v4 la rumeur continue

DeepSeek V4 : 1T paramètres, puces Huawei, contexte 1M tokens et pricing à $0.30/MTok. Ce qu'on sait avant la sortie du modèle open-source le plus attendu de 2026.
Deepseek nous remet un coup eux-même parce qu'ils teasent énormément sur leur prochaine version: v4.
Vous le savez peut-être j'aime énormément le modèle v3.2 de Deepseek.
Il a un coût dérisoire et se débrouille vraiment bien sur des petites tâches, même s'il est un peu lent.
Qu'en est-il du modèle v4 ?
DeepSeek V4 : ce qu'on sait avant la sortie
DeepSeek V4 est le modèle le plus attendu de 2026 côté open-source. Initialement prévu pour février, il a été repoussé plusieurs fois. Le lancement semble imminent (fin avril d'après les dernières sources officielles).
Architecture
- 1 trillion de paramètres au total, mais seulement ~37 milliards activés par token grâce au Mixture-of-Experts (MoE)
- Fenêtre de contexte d'1 million de tokens
- Nouvelle architecture mémoire appelée "Engram" qui sépare la récupération de patterns statiques du raisonnement dynamique
- Multimodal natif : texte, image et vidéo
Benchmarks (non vérifiés)
- 90% sur HumanEval et 80%+ sur SWE-bench selon des benchmarks internes qui restent à confirmer par des tiers
- V4-Lite déjà testée en API avec une amélioration de 30% en vitesse d'inférence et un recall de 94% à 128K tokens
Le virage hardware : Huawei au lieu de NVIDIA
C'est probablement l'info la plus marquante :
- V4 tournera sur les puces Huawei Ascend, une rupture nette avec la dépendance au hardware américain
- DeepSeek a volontairement refusé l'accès anticipé aux fabricants de puces US
- Alibaba, ByteDance et Tencent ont passé des commandes massives de puces Huawei en prévision
Pricing
- Tarif estimé à ~$0.30/MTok, soit potentiellement 50x moins cher que les modèles frontier concurrents
- Open-source sous licence Apache 2.0 (comme V3 et R1)
Ce que ça change pour les devs
- Un modèle frontier gratuit et self-hostable, c'est une pression énorme sur les providers closed-source
- Le pricing à $0.30/MTok va forcer tout le marché à s'aligner
- La fenêtre d'1M tokens ouvre des usages concrets : analyse de repos entiers, review de docs massives
- Mais attention : rien n'est vérifié indépendamment pour l'instant
FAQ
C'est quoi la différence entre 1 trillion de paramètres et les 37 milliards activés ?
DeepSeek V4 utilise une architecture Mixture-of-Experts : le modèle dispose d'un trillion de paramètres au total, mais n'en sollicite qu'une petite fraction à chaque inférence. Cela permet d'avoir la capacité d'un très grand modèle sans en payer le coût computationnel à chaque requête.
Pourquoi le passage aux puces Huawei est-il important ?
C'est un signal fort d'indépendance vis-à-vis de l'écosystème hardware américain, dans un contexte de restrictions à l'export. Le fait qu'Alibaba, ByteDance et Tencent aient déjà commandé massivement des puces Huawei montre que ce virage est pris au sérieux par toute l'industrie tech chinoise.
À quel point le prix de $0.30/MTok est-il agressif ?
Selon les estimations avancées, ce serait environ 50 fois moins cher que les modèles frontier concurrents comme GPT-4 ou Claude. Si ce tarif se confirme, cela exercera une pression très forte sur les providers closed-source pour revoir leur grille de prix.
La fenêtre de 1 million de tokens, ça sert concrètement à quoi ?
Elle permet d'envoyer des bases de code entières, des documents massifs ou de longues conversations sans découpage. Des tâches comme la revue d'un dépôt complet ou l'analyse d'une documentation volumineuse deviennent beaucoup plus simples à automatiser.
Est-ce que ces informations sont fiables ?
Pour l'instant, non. Les benchmarks cités viennent de sources internes non confirmées par des tiers indépendants, et les dates de sortie ont déjà été repoussées plusieurs fois. Il vaut mieux attendre le lancement officiel avant de planifier quoi que ce soit autour de ce modèle.

Alexandre P.
Développeur passionné depuis plus de 20 ans, j'ai une appétence particulière pour les défis techniques et changer de technologie ne me fait pas froid aux yeux.
Poursuivre la lecture


