Un agent de code 100 % local
Dans cette vidéo on va installer un agent de code en local, sans passer par les services en ligne Claude code ou GPT Codex.

Quand on attaque un agent de code, le réflexe par défaut c'est le service en ligne. Mais il existe une autre voie, imparfaite mais intéressante, pour ceux que la privacy ou le budget concernent vraiment.
Le premier réflexe, donc, c'est de dégainer Claude Code, GPT Codex, ou à la limite Opencode branché sur OpenRouter avec les models chinois du moment :
- DeepSeek
- GLM
- Minimax
- Mimo
- Qwen
- etc...
Rien de mal à ça. Sauf que vous payez, soit un abonnement, soit à la conso.
Et il y a une alternative que peu de gens testent vraiment : faire tourner l'agent en local, sur votre propre machine. Je vous montre comment je m'y prends.
De quoi on a besoin pour démarrer ?
2 briques, pas plus :
- LM Studio, pour lister, télécharger et déployer les models open source sur votre réseau local.
- Opencode, qui va servir de harness.
Un harness, c'est tout l'échafaudage qui transforme un simple modèle de langage en agent capable d'agir. La boucle qui enchaîne réflexion, appels d'outils et observations, plus l'accès aux fichiers, au shell et au reste de votre environnement. Le modèle fournit l'intelligence, le harness fournit les mains. Sans lui, le LLM ne fait que parler.
Comment brancher Opencode sur un model local ?
Là, petit piège. Par défaut Opencode vous demande une clé API et vous fait pointer sur des API de models en ligne. La plupart des gens passent par OpenRouter, mais vous pouvez tout aussi bien utiliser les clés des fournisseurs en direct.
Sauf que nous, on veut du local. Donc je vous recommande le plugin opencode-lmstudio.
Disclaimer : Opencode vient de se mettre à jour et la dernière version casse la compatibilité de l'extension. Pas de panique, j'ai fait un fork qui fixe le problème.
Clonez le repo en local :
https://github.com/aluzed/opencode-lmstudio
Et si vous utilisez ma version, remplacez ceci dans votre opencode.json (~/.config/opencode/opencode.json) :
"plugin": ["opencode-lmstudio@latest"],
Par cela :
"plugin": ["file:///var/www/lmstudio/opencode-lmstudio"],
Je vous laisse mettre le path qui correspond à l'emplacement du repo sur votre machine.
On charge le model et on teste
Direction LM Studio. Téléchargez votre model. Dans mon cas un Qwen 3.5 9B, dont j'ai poussé le contexte à 128K tokens.
Une étape qu'on oublie souvent : une fois le model chargé, allez le configurer et surtout activez le réseau pour qu'il soit accessible.
Ensuite, un petit curl confirme que LM Studio répond bien sur le réseau. Opencode va pouvoir lui parler.
Je crée un dossier pong et je lance un test rapide :
Créer un pong en HTML/JS
Et le model se met au boulot.
Et concrètement, ça vaut quoi ?
Soyons honnêtes : ce n'est pas encore parfait. Forcément, c'est un petit model sur une petite machine. Pas de quoi casser 3 pattes à un canard.
Mais ça donne une idée des perspectives avec une meilleure config. Et pour du code sensible ou un budget serré, l'argument privacy plus zéro coût à la conso commence à peser.
Je me demande surtout: partir de quelle taille de model et quelle machine le rapport qualité-confidentialité-prix bascule en la faveur d'une IA locale ?