Benchmark de Minimax M2.7

Aujourd'hui, on va tester Minimax m2.7 dans un benchmark de jeu 3D et voir comment il s'en sort.
Je vous en parlais la dernière fois
Minimax est sorti en version M2.7 avec des benchmarks qui montre un niveau pas mauvais, légèrement en retrait par rapport à Opus 4.6.

Le benchmark
On ne change pas une équipe qui gagne, j'utilise mon prompt de Hotdog Simulator 3D où le but est de faire des hotdogs très rapidement pour satisfaire nos clients.
On va voir ce que nous a pondu Minimax M2.7 sur cet exercice qui sort de l'ordinaire.
Oui, je suis conscient que ce n'est pas significatif de sa capacité à coder des projets "normaux", mais je veux voir sa capacité à s'adapter à des exercices nouveaux. Car, dans chaque projet, il y a des scénarios qu'on a jamais vu.
Résultat
Minimax m'a sorti quelque chose de pas très fonctionnel malheureusement. Mais il fait déjà mieux qu'Opus d'une certaine façon qui fait quelque chose où on ne peut rien faire.
Au moins ici on peut commencer à mélanger des ingrédients, mais on ne peut ni servir nos clients et les ingrédients disparaissent...
Donc, on attend le timer, c'est tout... Dommage.

Coût
Pour faire cet exercice, Minimax m'a coûté 0.05$ ce qui n'est pas grand chose.
Bon, c'est tant mieux étant donné l'inefficacité du résultat...

Bilan
Sur cet exercice c'est moyen, mais je n'exclus pas de lui faire faire autre chose à l'occasion.
J'ai hâte de le tester sur un exercice plus réaliste.
De même, je ferai prochainement un récapitulatif global de tous les benchmarks et on va comparé les résultats (le code source) également pour voir la qualité du rendu.

Alexandre P.
Développeur passionné depuis plus de 20 ans, j'ai une appétence particulière pour les défis techniques et changer de technologie ne me fait pas froid aux yeux.
Poursuivre la lecture

