Alibaba Zhenwu M890: le gpu ia monstrueux

Alibaba dévoile le Zhenwu M890, une puce IA de 144 Go de VRAM annoncée trois fois plus puissante que le H20 de Nvidia. Un signal fort sur la souveraineté technologique chinoise.
Grosse annonce: Alibaba cloud sort son Zhenwu M890 !
Qu'est ce que c'est que cette sorcellerie ?
C'est la puce souveraine chinoise censé offrir la puissance de calcul nécessaire au pays afin de faire tourner ses models IA.
Pour rappel, le pays ne disposait que de puce Nvidia H20 de 96GB Vram à cause de l'embargo, c'est a dire une version castrée de la H200 de 141GB Vram.
Et le champion désigné par la Chine s'appelle Zhenwu M890 de 144GB Vram, une bête qui, d'après les dires serait 3 fois plus performant que le H20.

Et la version précédente le Zhenwu 810E était apparemment déjà équivalente au H20.
C'est une démonstration en termes d'évolution.
La Chine est un exemple en matière de progrès dans l'IA
Non seulement, elle sort des modèles compétitifs mais en plus, se paie le luxe de rendre ça open source en guise de leçon.
On devrait fortement s'en inspirer.
Aujourd'hui, on a plus que jamais besoin de prendre le virage stratégique pour la capacité de travail de demain.
Je ne pense pas que l'IA est un remplaçant au sens strict à la capacité de travail humaine.
Mais je pense que c'est un outil qui vient en addition du travail manuel.
Si notre état est tributaire d'un autre pour se fournir en capacité de travail, alors on se met dans une posture à risque pour les décennies qui vont suivre.
De même, l'IA étant un accélérateur de progrès, cela implique directement notre capacité à accéder à un futur où le rythme d'innovation atteindra une cadence jusqu'alors inconnue dans l'histoire de l'humanité.
FAQ
C'est quoi exactement la puce Zhenwu M890 ?
C'est un processeur développé par Alibaba Cloud pour répondre aux besoins en calcul IA de la Chine, avec 144 Go de VRAM. Elle est présentée comme trois fois plus performante que la H20 de Nvidia, qui était jusqu'ici la puce la plus puissante accessible au pays du fait des restrictions américaines à l'export.
Pourquoi la Chine était-elle limitée aux puces H20 de Nvidia ?
L'embargo américain interdit à Nvidia de vendre ses puces les plus performantes à la Chine. La H20, version bridée de la H200, était donc le plafond légal disponible, avec seulement 96 Go de VRAM contre 141 Go pour la H200.
À quel point cette évolution est-elle rapide ?
La génération précédente, le Zhenwu 810E, était déjà considérée comme équivalente à la H20. Passer à trois fois ses performances en une génération représente un rythme d'évolution particulièrement soutenu pour une filière qui partait de zéro sur ce segment.
Pourquoi l'open source chinois est-il perçu comme une leçon stratégique ?
En rendant ses modèles IA accessibles à tous, la Chine démontre qu'elle peut concurrencer les acteurs occidentaux tout en accélérant l'adoption mondiale de ses technologies. Cela contraste avec la tendance à fermer les modèles les plus puissants derrière des accès payants ou restreints.
Quel risque concrètement pour un pays qui ne maîtrise pas ses infrastructures IA ?
Dépendre d'un autre État pour accéder à la capacité de calcul, c'est s'exposer à des ruptures d'approvisionnement ou à des pressions géopolitiques. Dans un contexte où l'IA conditionne de plus en plus le rythme d'innovation industrielle et économique, cette dépendance peut peser lourd sur les décennies à venir.

Alexandre P.
Développeur passionné depuis plus de 20 ans, j'ai une appétence particulière pour les défis techniques et changer de technologie ne me fait pas froid aux yeux.
Poursuivre la lecture


