Deepseek v4 la rumeur continue

DeepSeek V4 : 1T paramètres, puces Huawei, contexte 1M tokens et pricing à $0.30/MTok. Ce qu'on sait avant la sortie du modèle open-source le plus attendu de 2026.
Deepseek nous remet un coup eux-même parce qu'ils teasent énormément sur leur prochaine version: v4.
Vous le savez peut-être j'aime énormément le modèle v3.2 de Deepseek.
Il a un coût dérisoire et se débrouille vraiment bien sur des petites tâches, même s'il est un peu lent.
Qu'en est-il du modèle v4 ?
DeepSeek V4 : ce qu'on sait avant la sortie
DeepSeek V4 est le modèle le plus attendu de 2026 côté open-source. Initialement prévu pour février, il a été repoussé plusieurs fois. Le lancement semble imminent (fin avril d'après les dernières sources officielles).
Architecture
- 1 trillion de paramètres au total, mais seulement ~37 milliards activés par token grâce au Mixture-of-Experts (MoE)
- Fenêtre de contexte d'1 million de tokens
- Nouvelle architecture mémoire appelée "Engram" qui sépare la récupération de patterns statiques du raisonnement dynamique
- Multimodal natif : texte, image et vidéo
Benchmarks (non vérifiés)
- 90% sur HumanEval et **80%+ sur SWE-bench **selon des benchmarks internes qui restent à confirmer par des tiers
- V4-Lite déjà testée en API avec une amélioration de 30% en vitesse d'inférence et un recall de 94% à 128K tokens
Le virage hardware : Huawei au lieu de NVIDIA
C'est probablement l'info la plus marquante :
- V4 tournera sur les puces Huawei Ascend, une rupture nette avec la dépendance au hardware américain
- DeepSeek a volontairement refusé l'accès anticipé aux fabricants de puces US
- Alibaba, ByteDance et Tencent ont passé des commandes massives de puces Huawei en prévision
Pricing
- Tarif estimé à ~$0.30/MTok, soit potentiellement 50x moins cher que les modèles frontier concurrents
- Open-source sous licence Apache 2.0 (comme V3 et R1)
Ce que ça change pour les devs
- Un modèle frontier gratuit et self-hostable, c'est une pression énorme sur les providers closed-source
- Le pricing à $0.30/MTok va forcer tout le marché à s'aligner
- La fenêtre d'1M tokens ouvre des usages concrets : analyse de repos entiers, review de docs massives
- Mais attention : rien n'est vérifié indépendamment pour l'instant

Alexandre P.
Développeur passionné depuis plus de 20 ans, j'ai une appétence particulière pour les défis techniques et changer de technologie ne me fait pas froid aux yeux.
Poursuivre la lecture dans la rubrique News

