Djin2
Lien vers l'application
http://cdsdjin/
Avancement
Installation
Djin2 est composé d'une partie serveur mettant à disposition un
webservice.
Il comporte également une partie client avec des applications web :
djin-client et
djin-client-admin.
Pour installer Djin2, suivez les instruction d'
Installation.
Technologies
Serveur / Webservice
Java (javax.ws)
Java a été choisi notamment pour des raisons de maintenance, c'est le langage le plus utilisé à l'Observatoire.
Ce choix est également motivé par la compatibilité avec la librairie Grobid, qui a une place importante dans ce projet.
Grobid
[...]
Clients
Angular2
Pourquoi une application web plutôt qu'une application desktop ?
- Développement plus rapide ;
- Ré-utilisabilité de certains éléments pour d'autres applications web (pour mettre à disposition des documents traités par exemple) ;
- Adapté à l'utilisation des documentalistes, où le navigateur web a une place importante (à vérifier).
Fonctionnement
Entraînement et Apprentissage
Pour détecter automatiquement des objets astronomiques dans un document, Djin2 utilise la librairie Grobid.
La détection est réalisée à partir d'un modèle probabiliste généré lors d'une phase d'apprentissage.
Afin de comprendre son fonctionnement et son intégration dans Djin2, rendez vous à
Entraînement et Apprentissage.
Configuration et Performances
Performances
Pour la recherche d'objets astronomiques dans un document :
- Document PDF :
La phase qui prend le plus de temps est pdf2Xml et fullTextProcess.
La taille du model entraîné n'a que peu d'importance.
Configuration
Grobid consomme essentiellement du CPU. Un nombre élevé de thread augmente la rapidité de traitement.
Un stockage SSD performant améliore la rapidité de traitement de pdf2Xml.
La RAM, quant à elle, a moins d'importance, 8 Go de RAM dédiées sont suffisantes.