Tags:
create new tag
, view all tags
-- ChristianBonnin - 24 Jun 2008 ++Evaluation d'outils de reconnaissance de caractères dans les images Les résultats sont plutôt mauvais même pour des images a priori faciles.

Et même lorsque des noms d'objet sont correctement extraits, l'OCR commet souvent des erreurs dans les chiffres qui obligent à vérifier très soigneusement tous les noms. Pour l'utilisateur, le gain est donc très faible.

Les outils testés sont des programmes d'OCR en open-source écrits en C++. Je n'en ai pas trouvé en Java.

Dans le tableau, les chiffres indiquent le nombre de noms d'objet correctement extraits par rapport au nombre de ceux présents dans l'image. On peut cliquer dessus pour lire le texte extrait par l'outil.

Image
----
Outil
2006AJ....131.1544B
figure 6
Sort
2006ApJ...636...90H
figure 20
Sort
2006MNRAS.371..703S
figure 6
Sort
Tesseract 1 / 16 6 / 9 0 / 8
GOCR 0 / 16 2 / 9 0 / 8
Topic attachments
I Attachment Action Size Date Who Comment
PNGpng aj131.1544-6.png manage 336.6 K 2008-06-25 - 10:30 UnknownUser  
JPEGjpeg apj636.90-20.jpeg manage 183.9 K 2008-06-25 - 10:30 UnknownUser  
PNGpng mnras371.703-6.png manage 126.4 K 2008-06-25 - 10:31 UnknownUser  
Topic revision: r3 - 2008-06-25 - ChristianBonnin
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2024 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback