Test des OCR IA

Test des OCR IA
Alexandre P. dans Dev - mis à jour le 10-05-2026

Je teste Mistral Document IA et Deepseek OCR 2 dans un benchmark OCR complexe. On va voir comment ils s'en sortent.

Je teste souvent les OCR IA, je me dis qu'il est temps de refaire un essai des derniers modèles car il y a du nouveau depuis.

J'en parlais il y a un moment dans cet article.

J'utilise souvent l'OCR surtout pour mettre en place des services de GED, la GED étant un outil central des entreprise de moyenne taille et plus.

Qu'est-ce qui a changé dans l'OCR depuis

Deepseek a sorti la V2 de son OCR qui fonctionnait déjà très bien, mais pas "encore" parfaitement.

Et oui, on en attend toujours plus et je dois admettre que je veux quelque chose de vraiment solide du genre:

comprendre les images qu'il y a dans l'image

Et pas qu'un peu car j'aimerais qu'il soit capable de me détailler ce qu'il y a par exemple, vous scannez une page dans laquel il y a un graphique.

Est-ce que le model sait lire le graphique et l'expliquer ?

Je n'attends pas qu'une reconnaissance mais surtout une "intelligence".

Mistral Document IA

J'ai essayé notre champion français Mistral avec son outil Document IA.

Premièrement je suis très satisfait de l'utilisation.

J'ai pu récupérer un markdown depuis mon fichier: une page de magazine PC qui fait le benchmark de différents composants.

Voyons le résultat:

mistral.webp ><

Côté Mistral, je n'ai pas réussi à avoir le détail des charts même s'il arrive à me identifier comme image dans l'image.

J'ai vu qu'il propose un panel d'outils permettant de passer des annotations sur les images. Malheureusement, lorsqu'il s'agit comme dans ce cas, d'un benchmark où il y a beaucoup d'élément non normalisés (noms différents pour chaque ligne), ce n'est pas évident à mettre en place.

C'est dommage qu'il n'y ait pas encore d'auto-détection des éléments.

Deepseek OCR 2

Puis j'ai testé Deepseek OCR 2, la deuxième itération pour le champion chinois Deepseek qui avait déjà fait fort dans sa version 1.

Mais j'obtiens le même résultat que pour Mistral malheureusement:

deepseek-2.webp ><

Donc, je pense qu'on arrive à une des limitations actuelles des models OCR.

La suite ?

Comme vous le voyez, j'en attends plus de ces outils qui vous nous permettre de créer encore plus d'applications puissantes. Je pense aux RAG, à l'indexation automatique etc...

Beaucoup de cas d'usage où l'OCR est une brique centrale.

Malheureusement le résultat n'est pas encore au rendez-vous niveau perfection, même si cela conviendra déjà pour de nombreux cas d'usages.

Les tests ne sont pas finis, d'autant plus qu'il y a encore d'autres models OCR chinois que je testerai prochainement, entre QWEN qui est omnimodal ou encore Baidu Qianfan-OCR-Fast qui est gratuit sur Open Router.

Affaire à suivre.

#ocr#ia#ged#rag

user picture

Alexandre P.

Développeur passionné depuis plus de 20 ans, j'ai une appétence particulière pour les défis techniques et changer de technologie ne me fait pas froid aux yeux.