Google Gemini 3.5 Flash, une bête de puissance

Gemini 3.5 Flash est le nouveau modèle de Google DeepMind taillé pour les agents IA longue durée. Performances solides, vitesse accrue et tarifs accessibles dès maintenant via l'API.
Annoncé à Google I/O le 19 mai 2026, Gemini 3.5 est la nouvelle famille de modèles de Google DeepMind, positionnée autour des workflows agentiques de longue durée.
Google démarre la série avec 3.5 Flash, déjà disponible partout (app Gemini, AI Mode dans Search, Antigravity, Gemini API via AI Studio et Android Studio, Gemini Enterprise).
La version 3.5 Pro est annoncée pour le mois prochain, déjà utilisée en interne.
Côté perfs, 3.5 Flash prétend rivaliser avec les gros modèles frontière tout en restant environ 4 fois plus rapide en tokens/s.
Les chiffres mis en avant :
- 76.2% sur Terminal-Bench 2.1 (**Opus 4.7 **fait 69.7%)
- 1656 Elo sur GDPval-AA
- 83.6% sur MCP Atlas
- 84.2% sur CharXiv Reasoning (multimodal)
Annoncé comme supérieur à Gemini 3.1 Pro sur coding et tâches agentiques.
Le message marketing est classique : plus besoin d'arbitrer qualité vs latence.
L'intérêt de Gemini 3.5 Flash
Le vrai pitch porte sur les agents long-horizon orchestrés via le harness Antigravity, avec déploiement de sous-agents collaboratifs.
Démos mises en avant : refactor d'un legacy vers Next.js, synthèse du paper AlphaZero + jeu jouable en 6h, génération d'UIs interactives en parallèle.
Côté clients : Shopify (forecasts marchands), Macquarie Bank (onboarding sur docs de 100+ pages), Salesforce (Agentforce), Ramp (OCR de factures), Xero (workflows 1099), Databricks (monitoring de datasets).
Côté grand public, 3.5 Flash devient le modèle par défaut de l'app Gemini et d'AI Mode dans Search, et propulse Gemini Spark, un agent perso "24/7" en rollout chez les testeurs et bientôt en bêta pour les abonnés Google AI Ultra aux US.
Google insiste sur son Frontier Safety Framework avec des garde-fous renforcés cyber/CBRN et des outils d'interprétabilité pour auditer le raisonnement interne avant réponse.
Sur X, Google annonce avoir codé un OS entier et fonctionnel from scratch avec Gemini 3.5 Flash, en 12 heures !

Le prix de Gemini 3.5 Flash
Parlons maintenant de sujets qui fâchent. Enfin... dans ce cas précis, je dirais un sujet qui réconcilie !
Google Gemini 3.5 Flash est déjà sur OpenRouter à prix très abordable.
- 1.50$ / Mt input
- 9$ / Mt output (ici ça pique encore un peu mais j'ai vu pire)
C'est un prix raisonnable pour la puissance du model, pour info, on est loin du prix d'un Opus 4.7 Fast (30$ / Mt input et 150$ / Mt ouput) ou un Opus 4.7 (5$ / Mt input et 25$ / Mt output)
Ca a l'air très bon en tout cas !
FAQ
Gemini 3.5 Flash est-il vraiment disponible maintenant ou faut-il attendre ?
3.5 Flash est déjà accessible dès aujourd'hui via l'app Gemini, AI Studio, Android Studio, AI Mode dans Search et l'API. C'est 3.5 Pro qui arrive dans un mois environ, actuellement testé en interne chez Google.
Qu'est-ce qu'Antigravity exactement ?
C'est le système d'orchestration de Google qui permet de déployer et coordonner plusieurs sous-agents en parallèle sur des tâches longues et complexes. Les démos présentées incluent des refactors de code ou la génération d'interfaces complètes réparties entre agents collaboratifs.
Gemini 3.5 Flash va-t-il remplacer le modèle que j'utilise déjà dans l'app Gemini ?
Oui, il devient le modèle par défaut dans l'app Gemini et dans AI Mode de Search, donc le changement s'opère de façon transparente sans action de votre part.
Combien coûte Gemini 3.5 Flash via l'API ?
Sur OpenRouter, il est facturé 1,50 $ par million de tokens en entrée et 9 $ par million en sortie. C'est nettement moins cher que les modèles Claude Opus 4.7, qui montent jusqu'à 30 $/150 $ dans leur version rapide.
Les benchmarks avancés par Google sont-ils fiables ?
Google met en avant des scores élevés sur plusieurs benchmarks dont Terminal-Bench et CharXiv Reasoning, mais ces chiffres sont publiés par Google lui-même. Il reste prudent d'attendre des évaluations indépendantes avant de les prendre pour argent comptant.

Alexandre P.
Développeur passionné depuis plus de 20 ans, j'ai une appétence particulière pour les défis techniques et changer de technologie ne me fait pas froid aux yeux.
Poursuivre la lecture


